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1. fejezet 


Bevezetés 


A Veszprémi Egyetemen (jelenleg Pannon Egyetem) 1992-ben indult informatikatanár kép- 
zésben folyamatosan oktatunk mesterséges intelligenciához kapcsolódó ismereteket kötelező 
tárgyak keretében. Ezeket az órákat mind a nappali, mind a levelező képzésben részt vevő 
hallgatók szívesen látogatták és ismerkedtek meg olyan területekkel, amelyek informatikai 
műveltségüket emelték. Emellett olyan témákról is hallhattak, amelyek az oktatás területén 
is felhasználhatók. 

A Bolognai folyamat azonban átalakította a tanárképzés folyamatát, és az informatika- 
tanár MSc képzés ideje alatt kevesebb időt biztosít a mesterséges intelligencia témakörök 
bemutatására. Ezért szükségessé vált egy rövidebb terjedelmű, átgondoltabb jegyzet elkészí- 
tése. 

A mesterséges intelligencia kutatások célja olyan rendszerek (számítógépes programok, 
robotok) létrehozása, amelyek intelligens módon képesek feladatokat megoldani. Az utóbbi 
években egy új szemléletű, viselkedésalapú megközelítés van terjedőben, amely ezt a 
feladatot úgy fogalmazza meg, hogy a mesterséges intelligencia kutatások, fejlesztések célja, 
hogy a feladatmegoldást olyan szereplőkkel, ágensekkel végeztesse el, amelyek az intelligens 
viselkedés bizonyos vonásaival rendelkeznek. Ezért ezen új felfogás tükrében, az elsősorban 
informatikatanároknak szánt elektronikus jegyzet az , Ágens technológia? elnevezést kapta. 

A mesterséges intelligencia ismeretek oktatásához 2004-ben [19] készült egy egyetemi 
jegyzet informatikatanárok számára, de az ismeretek folyamatos változása és a korábban 
említett képzési folyamat megváltozása miatt szükségessé vált egy új elektronikus jegyzet 
megtervezése, elkészítése. 

A mostani képzési formában a hallgatók érdeklődése a téma iránt nem csökkent, ezért úgy 
gondoljunk, hogy egy célirányosan számukra összeállított, összefoglaló elektronikus jegyzet 
segítségével a rövidebb képzési idő ellenére is átfogó képet tudunk adni ezen tudományterület 
sokszínűségéről. 

Nagy örömünkre szolgál, hogy ezúttal egy magyar nyelvű, a magyar hallgatók által 
szabadon hozzáférhető tankönyv készülhetett ela TÁMOP-4.1.2-08/1/A-2009-0008 program 
támogatásával. 


Az egyes fejezetekhez — a terjedelmi korlátok által megengedett mértékben — igyekeztünk 
kidolgozott példákat és egyszerű animációkat is biztosítani, ami az elméleti anyagrészek 
megértését segítheti. 
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Reméljük, hogy elektronikus tankönyvünk nemcsak az informatikatanár szakos érdeklődő 
hallgatókat segíti majd abban, hogy az ágens technológia érdekes és izgalmas világával meg- 
ismerkedjenek, hanem más szakos hallgatók is érdeklődéssel olvasnak el egy-egy fejezetet 
vagy a teljes jegyzetet. 


Veszprém, 2011. június 17. 


Lakner Rozália, Werner Ágnes 
Pannon Egyetem 
Műszaki Informatikai Kar 
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2. fejezet 


Ágensek, multi-ágens rendszerek 


2.1. Alapok 


A számítógépek megalkotása óta foglalkoztatja a kutatókat az a probléma, hogy számítógép- 
programok és rendszerek mint önálló entitások fel tudják-e venni a versenyt az emberrel 
bizonyos területeken. Az egyszerű számológépektől kiindulva a fejlődés napjainkban el- 
érte azt a szintet, hogy a számítógépek alkalmazásával meglehetősen összetett problémák 
kezelése, támogatása vált elérhetővé. Néhány példát említve vállalatirányítási rendszerek, 
ipari folyamatok monitorozó és szabályozó rendszerei, orvosi diagnosztikai rendszerek, 
tervező rendszerek, robotok segítik az ember mindennapi munkáját. A gépek és az emberek 
, Versengése" azt a tendenciát eredményezi, hogy ezeket a rendszereket egyre inkább felru- 
házzák az emberekre jellemző képességekkel (például tanulás, természetes nyelv megértése, 
képek, hangok értelmezése), így ezek a rendszerek adott problématerületükön az emberrel 
egyenrangú szakértőknek, intelligens gépeknek tekinthetők. 


Egy intelligens rendszer a problémamegoldás során megszerzett ismeretei alapján oldja 
meg az adott feladatot és megadja ennek eredményét. Egy ilyen viszonylag független, 
önálló egységet ágensnek tekintünk. Az ágens eredete a latin ago, agere szó, melynek 
elsődleges jelentése mozgásba hoz, elintéz, cselekszik. A szó alapjelentése szerint ágens 
lehet mindaz, ami bizonyos fokú önállósággal bír, valamilyen környezet veszi körül, továbbá 
ezt a környezetet érzékeli és szükség esetén környezetébe beavatkozik. Ebben az értelemben 
ágensnek tekinthető egy ember, aki érzékszervei (pl. fül, szem, orr) segítségével érzékeli 
környezetét és különböző testrészei (pl. száj, kéz, láb) segítségével beavatkozik. Ágens 
lehet egy robot is, amely kamerái, szenzorai segítségével érzékel és motorokkal vezérelt 
beavatkozói (pl. robot karok) segítségével beavatkozik. Ágens lehet továbbá egy szoftver 
is, amelynél input és output adatok (kódolt bitsorozatok) formájában történik az érzékelés 
és a beavatkozás. Ki kell hangsúlyozni azonban, hogy környezet nélkül nem ágens az 
ágens. Például egy programkód önmagában nem tekinthető ágensnek, megfelelő környezetbe 
ágyazott működése során válik azzá. 
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2.2. Ágensek és tulajdonságaik 


Az ágens egy környezetébe ágyazott entitás, amely a környezetének aktív részeként azzal 
kapcsolatban áll, szükség esetén környezetébe beavatkozhat, vagy kommunikálhat más 
ágensekkel (lásd 2.1. ábra). 





2.1. ábra. Ágens és környezete 


(Megjegyzés: Az ágens fogalmának könnyebb megértéséhez futtassa az agensszemanti- 
kus.exe fájlt.) 
Egy ágens legfontosabb tulajdonságai a következők: 


e Környezetbe ágyazottan működik, a környezetén kívül állapotai nem értelmezhetők. 


e Képes a környezetét észlelni, azaz figyeli a környezet valamely tulajdonságát vagy 
tulajdonságait, valamint ezek változásait. 


e Képes a környezetére hatni, azaz valamilyen cselekvés végrehajtásával a környezetébe 
beavatkozhat. 


e Autonóm, azaz önálló működésre képes. 
Egy ideális ágens rendelkezhet további tulajdonságokkal is: 
e Képes a többi ágenssel kommunikálni, például helyzetét jelezni, tudását megosztani. 


e Célvezérelten működik, céljai elérése érdekében cselekszik, amely cél általában a 
rendszer globális céljának elérése (pl. mattadás egy sakkjátszmában, padló koszos 
részének megtisztítása). 


e Környezetéről csak részleges információkkal rendelkezik, például csak a közvetlen 
környezetét érzékelt. 
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e Saját erőforrásokkal rendelkezik. 


e Racionálisan, helyesen cselekszik, azaz nem cselekszik tudatosan céljai ellen és 
igyekszik a lehető legjobb alternatívát választani. 


2.3. Ágensek csoportosítása 


Az ágenseket képességeik és viselkedésük alaján a következő csoportokba sorolhatjuk. 


2.3.1. Reflexszerű ágensek 





2.2. ábra. Reflexszerű ágens 


A reflexszerű ágens (lásd 2.2. ábra) feltétel-cselekvés szerkezetű szabályai (szabályokról 
részletesebben a 6. fejezetben lesz szó) alapján gyors, egyszerű működést lát el (például 
egy autóvezető ágens szabálya , ha az előző autó fékez, akkor kezdj fékezni"). Az érzékelés 
ebben az esetben közvetlenül meghatározza a végrehajtandó cselekvést, ezért az ágensnek 
nem szükséges információt tárolnia a múltbeli viselkedéséről. Működése nagyon egyszetű: 
észleli a környezet jelenlegi állapotát, keres egy ehhez az állapothoz illeszkedő szabályt, majd 
végrehajtja a szabály következmény részében szereplő cselekvést. Ilyen működést mutat 
például egy egyszerű helyesírás-ellenőrző vagy egy adatgyűjtő ágens. 


2.3.2. Belső állapottal rendelkező ágensek 

A belső állapottal rendelkező ágens (lásd 2.3. ábra) olyan reflexszerű ágensként fogható 
fel, amely a világ korábbi állapotát belső állapotában tárolja. Így nemcsak az aktuális állapot 
ismeretében dönthet, hanem a korábban észlelt értékeket is figyelembe veheti. A korábbi 
állapot nyilvántartása összehasonlítási alapot szolgáltat arra vonatkozóan, hogy mi változott. 
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Ebben az esetben kétfajta információ figyelembevétele szükséges: egyrészt hogyan változik 
a világ az ágenstől függetlenül (például előzést végrehajtó autó helyzetének változása az 
ágenshez képest), másrészt az ágens cselekedetei hogyan befolyásolják a világot (például 
sávváltás esetén üres hely marad a korábban használt sávban). 





2.3. ábra. Belső állapottal rendelkező ágens 


2.3.3. Célorientált ágensek 





2.4. ábra. Célorientált ágens 


A célorientált ágens (lásd 2.4. ábra) rendelkezik egy elérendő állapottal, céllal is 
(például autóvezető ágens meghatározott úticéllal). Az ágens ebben az esetben a cél elérése 
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érdekében tervet készít cselekedete előtt. Ez a feladatok többségénél bonyolult, többlépéses 
következtetést igénylő feladat, amely magában foglalja a keresést (lásd 3. fejezet) is. 


2.3.4. Hasznosságorientált ágensek 


A célorientált ágensek elérendő céljuknak megfelelően többlépéses tervet készítenek cseleke- 
deteik előtt. Az ágensek számára megadott célok azonban nem mindig egységesek, több cél 
esetében lehetnek ellentmondóak. Ebben az esetben egy úgynevezett hasznossági függvény 
megadásával két vagy több állapot összehasonlíthatóvá válik, ezzel az ellentmondás felold- 
ható. A hasznosságorientált ágens (lásd 2.5. ábrát) a hasznossági függvényt felhasználva 
hoz döntéseket, készít tervet. Erre példa egy olajfinomító-vezérlő ágens vagy egy tőzsdei 
részvény-vásárló ágens. 





2.5. ábra. Hasznosságorientált ágens 


2.4. Ágens környezetek 


Az ágensek működése az ágensek képességén kívül a környezetük tulajdonságaitól is függ. 
A továbbiakban áttekintjük a környezetek legfontosabb osztályozási szempontjait. 


2.4.1. Hozzáférhetőség 


Egy környezet teljesen megfigyelhető, ha az ágens érzékelő berendezései révén hozzáfér- 
hetőség biztosított a környezet teljes állapotához. Ez kényelmes lehet, hiszen a környezet 
változásának nyomon követéséhez nem kell nyilvántartani semmilyen belső állapotot. Zajos, 
pontatlan érzékelők esetén vagy amennyiben bizonyos állapotok nem hozzáférhetők, részle- 
gesen megfigyelhető környezetről beszélünk. 
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2.4.2. Meghatározottság 


Determinisztikus környezetről beszélünk akkor, ha a környezet következő állapotát egyér- 
telműen meghatározza az előző állapot és az ágens cselekedete (például sakkozó ágens). 
Ellenkező esetben a környezet sztochasztikus (például autóvezetésnél a defektet véletlenszerű 
események tekintjük). Amennyiben a környezet teljesen megfigyelhető és determinisztikus 
együttesen, akkor az ágensnek nem kell bizonytalanságot kezelnie. 


2.4.3. Epizódszerűség 


Az epizód észlelések és cselekvések egy jól elkülöníthető sorozata, amelyben az elemi 
epizódok cselekedetei nem függnek az előző elemi epizódok cselekedeteitől (például egy 
hegesztő robot minden hegesztendő alkatrészt az előzőleg elkészített munkadarabtól függet- 
lenül kezelhet). Epizódszerű környezet esetén az ágens tapasztalata epizódokra bontható, és 
cselekvése kizárólag az adott epizódtól függ. Sorozatszerű környezet esetén minden egyes 
döntést a korábbi cselekedetek is befolyásolhatják (például a sakk sorozatszerű környezetnek 
tekinthető, azonban egy sakkverseny játszmái már epizódszerűek). 


2.4.4. Változékonyság 


Statikus környezetről beszélünk ha a környezet csak az ágens cselekedete következtében 
változhat (például sakk). A statikus környezet kezelése egyszerű, mivel az ágensnek nem kell 
figyelnie a környezet állapotát, miközben gondolkodik. Amennyiben a környezet (időben) 
folyamatosan változhat, úgy az dinamikus (például autóvezetés). 


2.4.5. Folytonosság 


Diszkrét környezet esetén az észlelések és cselekvések véges halmazzal adhatók meg (például 
sakkjátszma esetén véges számú lehetséges lépés és véges számú diszkrét állapot van). 
Folytonos állapotú környezet például az autóvezetés, ahol az autók sebessége, gyorsulása 
folytonos értékkészletű. 


2.5. Multi-ágens rendszerek 


A több, egymással kölcsönhatásban álló ágensből álló rendszereket multi-ágens rend- 
szereknek vagy több-ágenses rendszereknek nevezzük. Egy multi-ágens rendszer részei 
a következők: 


e Környezet, amely gyakorlatilag egy kiterjedéssel rendelkező tér. 
e Ágensek, amelyek a rendszer aktív elemei. 


e. Objektumok, amelyek a környezetben helyezkednek el. Ezek passzív elemek, amelye- 
ket az ágensek érzékelhetnek, létrehozhatnak, megsemmisíthetnek, módosíthatnak. 
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2.6. ábra. Multi-ágens rendszer 


, Műveletek, amelyek segítségével az ágensek érzékelik és manipulálják az objektumo- 
kat. 


e Relációk, amelyek objektumok és ágensek kapcsolatát írják le. 


e Környezet sajátosságait leíró szabályok, műveletek. 


A multi-ágens rendszerben szereplő ágenseknek általában korlátozott tudásuk, érzékelési 
és beavatkozási hatáskörük van. Jellegzetes képességük akommunikáció, amely segítségével 
megoszthatják egymással információikat, a kooperáció, amely az együttműködést biztosítja 
céljaik elérésében, valamint a koordináció, amely összehangolja a rendszer működését. 


2.6. Alkalmazási területek 


Az ágens rendszerek néhány jellemző felhasználási területe: 
e információs ágensek, 


e interfész ágensek, 


asszisztensek, 


ágens-alapú szimulációk, 


szoftvertechnológiai alkalmazások, 


intelligens épületek. 
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3. fejezet 


Keresések 


3.1. Alapok 


A mesterséges intelligencia olyan feladatok számítógépes megoldásával foglalkozik, ame- 
lyek megoldása nehéz, az embertől is kellő szakértelmet, kreativitást, intuíciót — azaz 
intelligenciát igényelnek. Ilyen feladat például a dámajáték vagy a sakk, a bűvös kocka 
kirakása, a matematikai tételbizonyítás és az orvosi diagnózis. 


A mesterséges intelligencia feladatok az alábbi közös vonásokkal jellemezhetők: 


e A feladat megoldása nehéz még az ember számára is, azonban ma még általában az 
ember a jobb. 


Nem rendelkeznek minden részletében tisztázott, fix megoldó mechanizmussal. 


A megoldás elemi tevékenységek sorozataként állítható elő, amely előre nem rögzített, 
és több lehetséges sorozat közül kell kiválasztani. 


A feladatmegoldás kereséssel történik, amely során szisztematikus próbálkozással 
választjuk ki a következő , lépést". 


A probléma tere nagy lehet, ezért az összes lehetőség kipróbálása a kombinatorikus 
robbanás problémája miatt szisztematikus módon nem lehetséges. A megoldás során 
irányított keresésre van szükség. 


Emberi szakértelem/ intuíció/ gyakorlati tapasztalat — úgynevezett heurisztikus ismeret 
— alkalmazásával korlátozható a keresés. (A heurisztikával vezérelt keresés a mester- 
séges intelligencia rendszerek legjellegzetesebb közös vonása.) 


. , Elég kedvező" megoldás elégséges. 


A mesterséges intelligencia feladatok megoldása legtöbbször arra az alapfeladatra vezet- 
hető vissza, amely során egy irányított gráfban keressük az egyik csúcsból egy másik csúcsba 
vezető utat. A látszólag különböző megoldási módszerek ellenére a feladatok végrehajtása, 
megoldása azonos algoritmus sémára vezethető vissza — ez az általános gráfkereső algorit- 
mus, amelyhez különböző vezérlési stratégiák rendelésével kapjuk meg a konkrét gráfkereső 
technikákat. 
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3.2. Kereső ágens 


A keresési feladat problémakitűzése a következő: 
. Adott: 


— a kezdeti állapot(ok), 
— műveletek/akciók halmaza, 


— célállapot vagy célteszt. 
e Meghatározandó: 
— egy a kezdeti állapotból egy célállapotba vezető út (akciósorozat). 


A kezdeti állapot és a lehetséges műveletek impliciten definiálják a feladat problématerét 
(állapotterét). A kereső ágens az állapottér felépítésével és szisztematikus bejárásával, 
módszeres próbálkozással oldja meg a feladatot. Ennek a folyamatnak egy elemi lépése 
az úgynevezett kiterjesztés, amely során a kereső ágens egy adott állapotból műveletek 
alkalmazásával újabb állapotokat (a kiindulási állapot gyermekeit) állít elő. A problé- 
mamegoldás lényeges kérdése, hogy a kiterjeszthető állapotok közül melyiket érdemes 
választani. Ennek megválaszolása különböző keresési technikákat eredményez, amelyek 
közül a legfontosabbakat a következő fejezetekben mutatjuk be. 

Az állapotteret irányított gráffal szemléltethetjük, amelynek csúcsai (csomópontjai) az 
állapotokat — beleértve a kezdeti- és célállapotokat —, élei a műveleteket reprezentálják. 
Amennyiben a keresés során előállított állapotok mindegyikét új állapotként vesszük figye- 
lembe, fa struktúrát kapunk. A továbbiakban keresőfák bejárásával foglalkozunk. 


A keresőfák bejárására használt általános keresési algoritmus lépései a következők: 


1. Legyen L a kezdeti állapoto(kajt tartalmazó lista. 


2. Ha L üres, akkor leállás — a keresés sikertelen; 


egyébként legyen n egy csomópont L-ből. 


3. Ha n célállapot, akkor leállás — eredmény megadása; 
egyébként 
e n törlése L-ből, 
. n gyermekeinek előállítása, 
. n gyermekeinek hozzáadása L-hez, 
e visszalépés 2-re. 
A bemutatott algoritmus szisztematikus módon állítja elő a keresőfát. Az algoritmusban 
szereplő L lista a kiterjeszthető csúcsokat, a keresés frontját tartalmazza. Ezt nyílt csúcsok 
halmazának is nevezik. Az algoritmus alkalmazásának legfontosabb kérdése, hogy a 2. 


lépésben melyik nyílt csúcsot válasszuk. Ahogy ezt már korábban is jeleztük, ennek 
megválaszolása a konkrét keresési technikáknál jelenik meg. 


A keresés hatékonyságát az alábbi szempontok szerint mérhetjük: 
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e talál-e megoldást? 
e a talált megoldás jó megoldás-e? (például alacsony útköltségű) 
e keresési eljárás költsége (idő- és memóriaigény). 


Általában megállapítható, hogy a keresés költségének meghatározásakor figyelembe kell 
vennünk mind a megoldás (út) költségét, mind a keresési eljárás költségét. 


3.3. Neminformált/vak keresések 


A neminformált vagy vak keresések nem tartalmaznak heurisztikus ismereteket. A kereső 
ágens képessége, hogy szisztematikus módon bejárja a keresőfát és felismeri, ha célállapotba 
jut. 


3.3.1. Szélességi keresés 


Szélességi keresés során a keresőfában mindig a , legmagasabb szinten" lévő csomópontok 
valamelyikét terjesztjük ki. Az algoritmust az általános keresési algoritmus (lásd 3.2. fejezet) 
következő módosításával írhatjuk le: 


e n az első csomópont L-ből (2. lépés) 
. n gyermekeinek hozzáadása L végéhez (3. lépés) 


azaz a nyílt csúcsok halmazának kezelésekor mindig az első elemet választjuk és a gyerme- 
keket a lista végére tesszük. 

A szélességi keresésre példa a 3.1. ábrán látható, a keresés lépéseit részletesen a 
szelessegi. avi fájl mutatja be (a fájl az AI Space Graph Searching http://aispace.org/search/ 
honlapon található segédprogrammal készült). 

Az algoritmus tulajdonsága, hogy amennyiben létezik megoldás, azt megtalálja (azaz 
teljes), a legjobb megoldást (a legkevesebb akcióból álló megoldási utak egyikét) találja meg 
(azaz optimális), memóriaigénye és időigénye az elágazások számában exponenciális (azaz 
bi, ahol b az elágazások/akciók száma, d a megoldás mélysége). 


3.3.2. Mélységi keresés 


Mélységi keresésnél a keresőfa , legmélyebb szintjén" lévő csúcsok egyikét terjesztjük ki. Az 
általános keresési algoritmus (lásd 3.2. fejezet) módosítása ebben az esetben a következő: 


e n az első csomópont L-ből (2. lépés) 
. n gyermekeinek hozzáadása L elejéhez (3. lépés) 


www.tankonyvtar. hu 0 Piglerné Lakner Rozália, Starkné Werner Ágnes, PE 


3.3. NEMINFORMÁLT/VAK KERESÉSEK 19 





L (nyílt csúcsok) 
A 


BC 

CDE 
DEFG 
EFGHIJ 
EGHIJ 
GHIJ 
HIJKL 
IJKLM 
JKLMNO 
KLMNO 





3.1. ábra. A szélességi keresés lépései 


L (nyílt csúcsok) 
A 

BC 

DEC 
HIJEC 
MIJEC 
IJEC 
NOJEC 








3.2. ábra. A mélységi keresés lépései 


azaz a nyílt csúcsok halmazának kezelésekor mindig az első elemet választjuk és a gyerme- 
keket a lista elejére tesszük. 


A mélységi keresésre példa a 3.2. ábrán látható, a keresés lépéseit részletesen a 
melysegi . avi fájl mutatja be (a fájl az AI Space Graph Searching http://aispace.org/search/ 
honlapon található segédprogrammal készült). 


Az algoritmus nem teljes (mivel végtelen ág lehetséges), nem optimális, memóriaigénye 
arányos a megoldás méretével és az akciók/elágazások számával (azaz b d), időigénye az 
elágazások számában exponenciális (azaz b9). 
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3.3.3. Egyenletes keresés 


Egyenletes keresés során a csomópontokhoz hozzárendeljük az adott állapotba vezető út 
költségét, s ennek figyelembe vételével a keresési fában mindig a pillanatnyilag legkisebb 
költségű csomópontok valamelyikét terjesztjük ki. 


Az általános keresési algoritmus módosítása: 
e n az első csomópont L-ből (2. lépés) 


, n gyermekeinek hozzáadása L-hez, majd L rendezése a csomópontok növekvő 
költsége szerint (3. lépés) 


ahol a költség a kezdeti állapotból az adott csomópontba vezető út költsége. 


Az egyenletes keresésre példa a 3.3. ábrán látható, a keresés lépéseit részletesen az 
egyenletes. avi fájl mutatja be (a fájl az AI Space Graph Searching http://aispace.org/search/ 
honlapon található segédprogrammal készült). 


JE L (nyílt csúcsok) 


A(0) 

BBC 

CA DG) E(7) 
DD E() KG) 


K(6) E(7) F(7) G(7) I) HB) 
A! ő RA E(7) F(7) G(7) K7) HG) N(8) O0(8) 


E(7) G(7) I) H(8) N(8) O(8) 
3.0 1.0 20 G(7) IC7) H(8) N(8) O(8) 


b e J(D H(8) N(8) 0(8) KO) L(10) 
H(8) N(8) O(8) KO) L(10) 
N(8) O(8) K(9) L(10) M(11) 


3.3. ábra. Az egyenletes keresés lépései 


Az algoritmus speciális változata a szélességi keresés (amennyiben az élek költségét 
egységnyinek tekintjük). Tulajdonságai a szélességi keresés tulajdonságaihoz hasonlóak. 


3.4. Informált/heurisztikus keresések 


A vak keresési algoritmusok hatékonyságának javítása, a feladatmegoldások számításigényé- 
nek csökkentése megvalósítható a feladathoz kapcsolódó információ, heurisztika figyelembe 
vételével. 

Heurisztika lehet bármely tanács, amely gyakran hatékony, azonban nem biztos hogy 
minden esetben az. A heurisztika technikailag megvalósítható egy kiértékelő függvénnyel, 
amely a probléma egy állapotához rendelt szám, amely legtöbbször a célállapot eléréséig 
hátralevő út költségét becslt. 
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3.4.1. Hegymászó keresés 


A hegymászó keresés során egy csomópont közvetlen leszármazottait vizsgáljuk, és ezek 
közül mindig a legjobbat választjuk. 


Algoritmusa a következő: 
1. Legyen n a kezdeti állapot. 
2. Ha n egy célállapot, akkor leállás — eredmény megadása; 
3. egyébként 


e n valamennyi n" leszármazottjának előállítása; 
e legyen n a legjobb a ; 


e visszalépés 2-re. 


Az algoritmus nem tárolja a kereső fát, csak a pillanatnyilag vizsgált csomópontot és 
ennek gyermekeit — így memóriaigénye minimális. Sikere azonban nagyban függ a bejárt 
felület alakjától. Hátránya, hogy a matematikában ismert gradiens módszerhez hasonlóan 
lokális szélsőérték keresésre alkalmas, optimális megoldás előállítása nem garantált. 


3.4.2. Előretekintő keresés 


Az előretekintő keresés elve megtalálni egy célállapotot, amilyen gyorsan csak lehetséges. 
A kiértékelés alapja ebben az esetben egyedül a céltól való távolság becsült értéke, amely 
alapján mindig a célhoz legközelebbnek tűnő csomópontot terjeszti ki. 


Az előretekintő keresést az általános kereső algoritmus alábbi módosításaként értelmez- 
hetjük: 


e n az első csomópont L-ből (2. lépés) 


. n gyermekeinek hozzáadása L-hez, majd L rendezése a csomópontok növekvő 
költsége szerint (3. lépés) 


ahol a költség az adott csomópontból a célba vezető út becsült költsége. 

Az előretekintő keresésre példa a 3.4. ábrán látható, lépéseit részletesen az eloretekinto. avi 
fájl mutatja be (a fájl az AI Space Graph Searching http://aispace.org/search/ honlapon 
található segédprogrammal készült). 

Az algoritmus hatékonysága jelentősen függ a becslő függvénytől, optimális megoldás 
nem garantált. 
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L (nyílt csúcsok) 

A(3) 

BW4CO) 

D(63) CG) EC8) 

I2) HB) JB) CG) E(8) 

N(0) O(2) HB) JG) CG) E(ő) 





3.4. ábra. Az előretekintő keresés lépései 


3.4.3. A és A algoritmus 


Az A algoritmus az egyenletes keresés és előretekintő keresés előnyös tulajdonságait 
egyesíti. Az egyenletes keresés a keresés biztonságának megtartását, az előretekintő keresés 
a kiterjesztések számának csökkentését segíti elő. A kiértékelés alapja a már megtett út (71 
csomópont tényleges távolsága a kezdeti állapottól: g(n)) és a még várható út (n csomópont 
becsült távolsága a céltól: A(n)) költségösszege (fn) — g(n) 4 h(n)). 


Az A algoritmus az általános kereső algoritmus alábbi módosításával definiálható: 


e n az első csomópont L-ből (2. lépés) 


. n gyermekeinek hozzáadása L-hez, majd L rendezése a csomópontok növekvő 
költsége szerint (3. lépés) 


ahol a költség az adott csomópont f(n) értéke, azaz a kifejtésre kerülő csúcs /(n) szerint 
minimális. 

Az A" algoritmus olyan A algoritmus, melynek heurisztikus függvénye minden csúcs 
esetén alsó becslés, azaz nem nagyobb, mint a ténylegesen hátralevő út költsége: 


Vn : hín) £ h(m). 
A heurisztikus függvényre adott alsó becslés kritérium biztosítja, hogy az A?" algoritmus 


mindig optimális megoldást szolgáltat. 

Az A" algoritmusra példa a 3.5. ábrán látható, a keresés lépéseit részletesenazacsillag. avi 
fájl mutatja be (a fájl az AI Space Graph Searching http://aispace.org/search/ honlapon 
található segédprogrammal készült). 

Amennyiben minden csomópont esetén A(n) —0, az egyenletes kereséshez jutunk. Amennyi- 
ben emellett az élek költsége egységnyi, a szélességi keresést kapjuk vissza. 


(Megjegyzés: A fejezethez tartozó gyakorló feladatok a Keresesek feladatok.pdf fájlban 
találhatók.) 


www.tankonyvtar.hu 0 Piglerné Lakner Rozália, Starkné Werner Ágnes, PE 


3.4. INFORMÁLT/HEURISZTIKUS KERESÉSEK 


23 





L (nyílt csúcsok) 


A(3) 
30 4 BD CW) 


nm 9 D(8) CO) E415) 
ő I(8) C(9) J(10) H(11) E(15) 
2.0 


A ad a N(8) C(9) JC10) OC10) H(11) E(15) 


3.5. ábra. Az A" algoritmus lépései 
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4. fejezet 


Logikusan gondolkodó ágens 


4.1. Alapok 


A logikusan gondolkozó ágens a világ aktuális állapota ismeretében a világ (általa) még 
nem ismert tulajdonságairól képes ismeretet előállítani. Ezzel kapcsolatos döntéseit logikai 
következtetések segítségével végzi. 

Ebben a fejezetben bemutatunk egy tényszerű ismereteken alapuló, hatékony következ- 
tetést megvalósító tudásreprezentációs technikát, a logikát. Ezen belül megismerkedünk 
az egyszerű igaz vagy hamis állítások leírására alkalmas nulladrendű logikával vagy más 
néven ítéletkalkulussal, és bonyolultabb állítások leírására alkalmas elsőrendű logikával 
vagy más néven predikátumkalkulussal. Mindkét kalkulus esetében bemutatjuk a nyelv 
szimbólumait (a kifejezéseket, amelyekkel bánni tudunk), s a kifejezésekkel történő építkezés 
szabályait — azaz a nyelv szintaxisát. Az így felépített mondatokat összekapcsoljuk a 
világgal, s amondatoknak jelentést adunk — ezáltal megismerkedünk a nyelv szemantikájával. 
Végül bemutatjuk azokat a mechanikus eljárásokat, következtetési módszereket, amelyek 
segítségével az adott szintaxis és szemantika mellett új mondatok, új ismeretek állíthatunk 
elő. 


4.2. Ítéletkalkulus 


4.2.1. Szintaxis 


Az ítéletkalkulus jelkészlete az alábbi elemekből áll: 
e ítéletváltozók (logikai változók): például p, ag, r, süt a nap, hétfő van, ... 
. ítéletkonstansok: T, F (igaz és hamis reprezentálására) 


e logikai műveleti jelek: — (negáció), V (vagy), A (és), — (implikáció), 


§ (azonosság) 


e elválasztó jelek: például ( ) (). 
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A szintaxis szabályai a következők: 
e atomi formula (atom) 


— minden ítéletkonstans atomi formula 


— minden ítéletváltozó atomi formula 
e formula 


— minden atomi formula egyben formula is 


— ha 4 és B formulák, akkor (4) (AV B), (AA B) (A a B) (A 8 B) 
kifejezések is formulák. 


A formulaképzés szabálya teljes (azaz segítségével az összes ítéletkalkulusbeli formula 
előállítható) és definíciójából láthatóan rekurzív. 


4.2.1. példa: Tekintsük a következő állításokat, és fogalmazzuk meg ezeket ítéletkalkulusbeli 
formulákkal: 

A1: Ha a hallgató sokat tanul, akkor jó zárthelyit ír. 

Az: Ha a hallgató jó zárthelyit ír, akkor megajánlott jegyet kap. 

Az: Megajánlott jegy esetén nem kell vizsgázni. 

Ax: Ha a hallgató sokat tanul, akkor nem kell vizsgáznia. 


Atomok (atomi formulák): 
p: a hallgató sokat tanul 
g: a hallgató jó zárthelyit ír 
r: a hallgató megajánlott jegyet kap 
s: a hallgató vizsgázik 


Formulák: 
H:pog 
F.:ger 
Fz:—-(sVvr) 
F4:pao -s 





A mondatokat leíró fenti formulahalmaz az eredeti állítások szerkezetét tükrözi. 











4.2.2. Szemantika 


A formulaképzés szabályaival előállított logikai formula egy szabályos szimbólumsorozat, 
amelynek igazságértéke ad jelentést. Ezt a szemantika szabályai szerint, az alábbi lépések- 
ben határozhatjuk meg: 


1. A formula interpretációja, amely minden ítéletváltozóhoz igaz (T) vagy hamis (F) érték 
rendelését jelenti minden lehetséges módon. 


2. Az interpretált formula kiértékelése a műveleti jelek szemantikája (igazságtáblák, lásd 
4.1. táblázat) alapján. 
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4.1. táblázat. A műveleti jelek szemantikája 




















p]g[[/DIPVa ][PÁg [DOCgd [pe g 
TITI F T T T T 
TIFI F T F F F 
FITÍT T F T F 
FIFÍfT F F T T 
































A formulákat értékük alapján formulaosztályokba sorolhatjuk: 


e Egy formula kielégíthető, ha van olyan interpretációja, amelyben igaz az értéke. 
e Egy formula érvényes (tautológia), ha minden interpretációban igaz. 


e Egy formula kielégíthetetlen, ha minden interpretációban hamis. 
A formulaosztályok között az alábbi kapcsolatok értelmezhetők: 


e ha x formula érvényes, akkor —z kielégíthetetlen (és fordítva) 
e ha x formula érvényes, akkor x kielégíthető (fordítva nem igaz). 


Két formulát ekvivalensnek tekintünk, ha minden interpretációban ugyanaz a logikai 
értékük. 

Néhány nevezetes ekvivalencia, logikai törvény: 

A $B-(AOG B)A(B—O A) 

Aa B-—-—-AVB 

AVB-BVA 

ANB-BANA 

(AVB VC-AV(BVO 

(A MB AC—-AA(BAO) 

(AV.BYyAC-(AVBJA(A VC) 

(A AB) V. C-(ANMB)V(AA OC) 

(AV PJ—- A 

(AMA T-—-A 

(AV D-T 

(A AP -—-F 

(AV-AJ—-T 

(AM—-A)—F 

—-— (6 A)— A 

-(AVB)—--—-4AAM—-B 

-(AMB)-—-AV-B 

AN(AV BA 

AV(AMNBJ—-A 

AVA—-A 

ANA—-A 
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4.2.3. Következtetés 


A következtető ágens fő képessége, hogy ismeretei és adott szabályai segítségével további 
ismereteket állít elő (azaz következtet). 


A következtetés mechanizmusának megértéséhez ismerkedjünk meg a logikai következ- 
mény fogalmával: Egy A formulának logikai következménye egy W formula akkor és csakis 
akkor, ha W igaz minden olyan interpretációban, amelyben A igaz. 

Jelölése: A F W (4-nak logikai következménye W) 


Példa: Vizsgáljuk meg a logikai következmény definíciója segítségével, hogy azaA (a — b) 
formulának logikai következménye-e b (azaz a A (a — b) F b)! 




















alb !aA(a— b) 
TT T 
TF F 
FT F 
FF F 




















Az igazságtáblából látható, hogy aA (a — b) formula egy esetben igaz, amikor a és b egyaránt 
igaz. Ebben az esetben b igaz, ezért a logikai következmény definíciója szerint beláttuk, hogy 
b logikai következménye a A (a — b) formulának. 














Mesterséges intelligencia feladatoknál a logikai következmény fogalmát a következőkép- 
pen használhatjuk: 


Aa, An)... An FW. 


Azaz bizonyos formulákról (A1, A2, . . . , An) tudjuk, hogy igazak. A logikai következ- 
mény definíciója szerint, ha W ezek logikai következménye, akkor W is igaz (tehát W-re 
következtethetünk). Kérdés az, hogy ezt az összes eset végignézése nélkül hogyan lehet 
eldönteni. 

Ennek megválaszolására a logikai következmény fogalmát értelmezhetjük az érvényesség 
és a kielégíthetetlenség fogalmával a következőképpen: 

A logikai következmény fogalmának értelmezése az érvényesség fogalmával: 

A1, A2, ...; An FW IEF (AA ALA ...A An) - W érvényes. 

Azaz W formula akkor és csakis akkor logikai következménye A: , A2, . . . , An formulák- 
nak, amennyiben (Az A 4A2 A... A An) - W formula érvényes. 


A logikai következmény fogalmának értelmezése a kielégíthetetlenség fogalmával: 

Ai, A2, ..., An FW IE AA AZA... A An A -aW kielégíthetetlen. 

Azaz W formula akkor és csakis akkor logikai következménye Ai , A2, . . . , An formulák- 
nak, amennyiben Az A 42 A... A An A —-W formula kielégíthetetlen. 


Az (AN ALN...A An) ? W formulát gyakran tételnek, A; A AZA... A Aun-t a tétel 
axiómáinak, feltételeinek, W-t következménynek, konklúziónak nevezzük. 


A továbbiakban a tételbizonyítás módszereit mutatjuk be. 
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Tételbizonyítás igazságtáblával 


Az igazságtáblával történő tételbizonyítás esetén a logikai következmény fogalmát, vagy 
annak értelmezését az érvényesség illetve a kielégíthetetlenség fogalmával használjuk. A 
tételbizonyítás első lépésében az igazságtábla szemantikája alapján a formulákat minden 
interpretációban kiértékeljük, majd a megfelelő definíciók szerint a kapott eredményt értel- 
mezzük. 


Példa: Tekintsük a következő formulákat: 
B:p7og 
Fo .:-7ag 
PF .-ap 
Kérdés: Fi és F2 formulák logikai következménye-e F3 formula(F A Fo F F3)? 
A példához kapcsolódó igazságtábla a következő: 




















D)dg PF, IF BA Fk PF BA FG Fz BAB N—-B 
TIT IT IF F F T F 
TŐ FIFIT F F T F 
FI TITIF F T T F 
F FITIT T T T F 









































Lehetőségek a tételbizonyításra: 


e Beláthatjuk, hogy minden olyan interpretációban, amelyben Fi és F? igaz, igaz F3 is 
(logikai következmény definíciója alapján). Az igazságtáblából látható, hogy Fi A F2 
egy esetben igaz, s ekkor igaz F3 is. 


e Bebizonyíthatjuk, hogy Fi; A F? GC F;3 érvényes (logikai következmény értelmezése 
az érvényesség fogalmával). Az igazságtábla 7. oszlopában látható, hogy a formula 
minden interpretációban igaz, azaz érvényes. 


e Beláthatjuk, hogy Fi A F2 A —-F3 kielégíthetetlen (logikai következmény értelmezése 
a kielégíthetetlenség fogalmával). Az igazságtábla utolsó oszlopában látható, hogy a 
formula minden interpretációban hamis, azaz kielégíthetetlen. 














Az igazságtábla módszerrel történő tételbizonyítás hátránya, hogy idő- és memóriaigénye 
az ítéletváltozók számában exponenciális (az igazságtábla sorainak száma 2", ahol n az 
ítéletváltozók száma). 


Tételbizonyítás formális levezetéssel 


A formális levezetéssel történő tételbizonyítás lényege, hogy egy axiómahalmazból (egy- 
szerű, érvényes formulákból) kiindulva levezetési (következtetési) szabályok alkalmazásával 
próbáljuk előállítani az igazolandó állítást (tételt). 
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A levezetési szabályok formulákból új formulák előállítását végzik. A legismertebb, 
gyakran alkalmazott levezetési szabály a modus ponens, amely A és A — B formulákból 
B formulát állítja elő, azaz: 


A 
AG B 
B 


Egy levezetési szabálytól elvárható, hogy az előállított formula a kiindulási formula 
(formulahalmaz) logikai következménye legyen. Ebben az esetben a levezetési szabály 
helyes. Igazságtábla módszerrel könnyen belátható, hogy a modus ponens helyes (azaz B 
logikai következménye A, A — B formuláknak). 

A levezetési szabály másik lényeges jellemzője, hogy képes-e minden logikai következ- 
mény formula előállítására, azaz teljes-e. A modus ponens nem teljes, azonban az egyszerű 
használhatósága miatt sokszor alkalmazzák mesterséges intelligencia rendszerekben, pl. 
szabály alapú szakértői rendszerek (lásd 7. fejezet) következtetési mechanizmusában. 

Egy másik levezetési szabály a rezolúció, amelynek legegyszerűbb formája a következő: 


AG B vagy -AVB 
Co A aCVvA 
Co B -aCvB 


Azaz a rezolúció az A  BésaC 3 A "formulákból a C — B formulát (vagy ezzel 
ekvivalens módona-4AV Bésa-C Vv A formulákból a —C V B formulát) állítja elő. 


A rezolúciós levezetési szabályt a következőképpen általánosíthatjuk: 


ai N...MAamobVv...Vbk 
ceN...Nep Pod v...Vdi ahol dj — a; 
ai N... AN... MA amNAciA Mc GbVv...VbevdiVv...Vvdgv...V di 





vagy 
agy V usa Vai V ÖL V asz Vb 
—aerV...V-en VdVv...Vdi ahol dj — a; 





—ai V... Vag V...V-amVv7-eV...V.-cen bv... be vdiv...Vdgv...V di 


Ez utóbbi levezetési szabály speciális formulákat, úgynevezett konjunktív normálfor- 
mákat tartalmaz. A konjunktív normálforma egy olyan formula, amely ítéletváltozók 
vagy negált ítéletváltozók (úgynevezett literálok) diszjunkcióinak (vagy kapcsolatainak) 
konjukcióiból (és kapcsolataiból) épül fel. A literálok diszjunkcióját klóznak nevezzük. A 
logikai törvények, ekvivalenciák alkalmazásával minden formulát átalakíthatunk konjunktív 
normálformává. 


A rezolúciós levezetési szabály helyes és teljes, azaz logikai következményt állít elő, s 
egyúttal minden logikai következmény előállítására képes. 


Tételbizonyítás rezolúcióval 


Rezolúcióval történő tételbizonyítás esetén a logikai következmény kielégíthetetlenséggel 
történő megfogalmazását használjuk fel, azaz a kiindulási formulákból (A1, A; , . . . , An F W) 
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és a következmény/célállítás (W ) negáltjából konjunkcióval képzett formula (AA Az A . . . A 
An A -W)kielégíthetetlenségét látjuk be. 

A rezolúciós eljárás maga egy cáfoló eljárás (ellentmondással történő bizonyítás), amely 
első lépéseként az előbbi módon képzett konjunktív normálforma klózairól feltételezzük, 
hogy igazak. A rezolúciós levezetési szabállyal új formulákat állítunk elő. Amennyiben 
ellentmondáshoz jutunk, a klózhalmaz kielégíthetetlenségét igazoltuk. 


4.2.3. példa: Tekintsük a 4.2.1. példában szereplő F, F2, F3, F4 formulákat, s igazoljuk 
rezolúcióval, hogy FI, F2, F3 formulák logikai következménye F4 (azaz By A F.A F3 A -F4 
kielégíthetetlen)! 


A formulák klózhalmaza a következő: 


Ci:-—pVva 
CC. :-gvr 
C3: as Var 
Ca :p 
Cs: s 


Lássuk be, hogy C7 . . . Cs klózhalmaz kielégíthetetlen! 


Indirekt bizonyítás (tegyük fel, hogy minden klóz igaz): 
C4 igaz, hap— T 
C5 igaz, has —T 
C! igaz, ha g — T (mivel -—p — F, C4-ből) 
C3 igaz, har — F (mivel -s — F, C5-bőlb) 
C5 igaz, hag — F (mivel r — F, C5-ból és C5-ből) ELLENTMONDÁS! 


A bizonyítás lépéseit szemléletesen a 4.1. ábrán levő rezolúciós gráf (más néven cáfolati gráf) 
mutatja, ahol az ellentmondást az üres klóz (NIL) jelöli. Az új klózok előállítása a rezolúciós 
levezetési szabály alkalmazásával történt a következőképpen: 


4.1. ábra. A bizonyítási eljárás szemléltetése 


C:apVag TESZ ee e 


C:agvr 







CsasVat 











—pv ag as Var —gvr Dp 
D S a "Pp 
g -g —g NIL 
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A korábban megfogalmazottak alapján az Ai, A2, . . . , An F W tételbizonyítás feladata 
visszavezethető Az A 4A2 A... A An A -—W formula kielégíthetetlenségének igazolására, 
amelynek megoldásához a rezolúciós eljárást használtuk. 


A rezolúciós eljárás lépései: 
1. Célállítás (W) tagadása, az aziómákhoz való hozzáadása. 
2. Az AN AN ...A Ah A -W formula klóz formára hozása (kiindulási klózhalmaz). 
3. Az ellentmondás (üres klóz, NIL) előállításáig: 


e a klózhalmazból két rezolválható klóz választása, 
e a kiválasztott klózok rezolvensének képzése, 


e a rezolvens klóz hozzáadása a klózhalmazhoz. 


A rezolválható klózok komplemens literálpárt (egy ítéletváltozót és ennek negáltját) 
tartalmaznak, a rezolvens klóz pedig a komplemens literálpár elhagyása után maradó részek 
diszjunkcióval összekapcsolva. 


A rezolúciós eljárás tulajdonságai: 


e algoritmusa nemdeterminisztikus (a rezolválható klózok választása nem egyértelmű — 
a 4.2. ábrán látható a 4.2.3. példában szereplő feladat egy másik megoldása), 


e helyes (logikai következményt állít elő), 


. teljes (minden logikai következmény belátható rezolúcióval). 


4.2. ábra. A bizonyítási eljárás szemléltetése — másik megoldás 


C:apVa 





apVr 
tése ző Dave] 
ölj MESS 
Úg seem geszzáleteéé ÉTM NIL 
€os e sepaz sza ezáetégezet ez ákéé ÉGETTE 


st 5 


4.3. Predikátumkalkulus 


Az ítéletkalkulus kifejező ereje felépítéséből adódóan nem teszi lehetővé a világ objektuma- 
inak, azok tulajdonságainak és kapcsolatainak leírását. A predikátumkalkulus formulái az 
ítéletkalkulushoz hasonlóan igaz vagy hamis állításokat reprezentálnak, azonban gazdagabb 
szintaxisa révén alkalmas az előbb megfogalmazott problémák kezelésére. 
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4.3.1. Szintaxis 


A predikátumkalkulus jelkészletében az ítéletkalkulus jelkészletén túl további elemek is 
megtalálhatók, ezek összességében a következők: 


e ítéletváltozók (logikai változók): például p, ag, r, süt a nap, hétfő van, ... 
e ítéletkonstansok: T, F (igaz és hamis reprezentálására) 


e logikai műveleti jelek: — (negáció), V (vagy), A (és), — (implikáció), 


§ (azonosság) 
e elválasztó jelek: például ( ) (1 
e. objektumváltozók (változók): például x, y, Z, ... 
e objektumkonstansok (konstansok): például a, b, c, ... 
e függyényszimbólumok: például f, g, hb, ... 
e predikátumszimbólumok: például P, O), R, ... 


e kvantorok: 3], V. 


A szintaxis szabályai a következők: 
e term 


— minden objektumkonstans term 

— minden objektumváltozó term 

— haf egy n-argumentumú függvényszimbólum és t1, . . ., tn termek, akkor f(ti, . . . , tn) 
is term 


e atomi formula (atom) 


— minden ítéletkonstans atomi formula 


— minden ítéletváltozó atomi formula 


—- ha P egy n-argumentumú predikátumszimbólum és tj, ..., ta, termek, akkor 
P(ti, . . . , tn) atomi formula 
e formula 


— minden atomi formula egyben formula is 


— ha A és B formulák, akkor (4), (AV B), (AA B) (A G B) (A 8 B) 
kifejezések is formulák 


— ha 4 egy formula és x egy változó, akkor a Vr A, ir A kifejezések is formulák. 
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A formulaképzés szabályaival úgynevezett jól formált formulák állíthatók elő rekurzív 
módon. 


4.5.1. példa: Tekintsük a következő állításokat és fogalmazzuk meg ezeket predikátumkal- 
kulusbeli formulákkal: 
Állítások: 

A1: Van olyan hallgató, aki minden előadáson figyel. 

A: Unalmas előadáson egyetlen hallgató sem figyel. 

Az: Egyetlen előadás sem unalmas. 

(Később feladatunk lesz annak megválaszolása, hogy Az és A; állításokból következik-e 
Az?) 


Predikátumok: 
H(2): x egy hallgató 
E(y): y egy előadás 
U(z): z unalmas 
F(a,y): z figyel y-on 


Formulák: 
Fy: 34Hiz) A vylE(y) 3 Fly] 
F, : vivzlE(2) AU(2) A H(2)] 0 -F(z, 2) 
F; : Vr—[E(2) A U(2)] 

















4.3.2. Szemantika 


A jól formált formulának a szemantika szabályai szerint adhatunk jelentést a következő 
lépésekben: 


1. a formula interpretációja 
e az értelmezés alaphalmazának, univerzumának (U nemüres halmaz) megválasz- 
tása 
e hozzárendelések: 


— minden konstans szimbólumnak egy elem megfeleltetése U-ból 


— minden n-argumentumú függvényszimbólumhoz egy U" Óó U leképezés 
rendelése 


— minden n-argumentumú predikátumszimbólumnak egy U" c (T, F) leké- 
pezés megfeleltetése 


2. a formula kiértékelése 


e ha 4, B formulák igazságértéke ismert, akkor -A, (A V B), 


(AA B), (A c B)(A e B) formulák igazságértékének meghatározása az 
igazságtáblák szemantikája (lásd 4.1. táblázat) alapján 
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vVr:A igazságértéke 7, ha A formula értéke minden z € U esetén 7, egyébként F 





e. 3rA igazságértéke 7, ha 4 formula értéke legalább egy z € U esetén 7, egyébként 
F. 


A formulákat értékük alapján az ítéletkalkulusnál megismert módon osztályokba sorol- 
hatjuk, így beszélhetünk a minden interpretációban igaz azaz érvényes, a minden interpretá- 
cióban hamis azaz kielégíthetetlen, és az igaz interpretációval rendelkező azaz kielégíthető 
formulákról. A problémát predikátumkalkulus esetén a formula összes interpretációban való 
kiértékelése jelenti, amely a szemantikai szabályainak megfogalmazásából láthatóan sokkal 
összetettebb és időigényesebb feladat, mint ítéletkalkulus esetében. 


4.3.3. Következtetés 


Az ítéletkalkulusnál megismert logikai következmény fogalma (valamint megfogalmazása az 
érvényesség és a kielégíthetetlenség fogalmával) predikátumkalkulus esetén is alkalmazható. 


4.3.3. példa: Tekintsük a következő formulákat: 

F, : vr(P(z) ? 0(2)) 

Fk 5 P(a) 

PF : (a) 

ahol x objektumváltozó, a objektumkonstans, P és 0 predikátumszimbólumok. 
Kérdés: F) és F; formulákból következik-e F3? 


A logikai következmény definíciója alapján a következőképpen gondolkodhatunk: 

Fi igaz minden x-re, speciálisan a-ra is. 

F 1gaz. 

Az implikáció igazságtáblája alapján F) és FF; igazsága esetén F;3 is igaz, tehát F3 logikai 
következmény.o 


Az ítéletkalkulusnál megismert cáfoló módszert is alkalmazhatjuk (a kielégíthetetlenség 
fogalmát felhasználva). Ekkor az előbbi példa esetén F; A F; A —F3 formula kielégíthetet- 
lenségét kell igazolnunk. A problémát ebben az esetben és predikátumkalkulusbeli formulák 
esetében általában az okozhatja, hogy az igazolandó formula kvantorokat, objektumváltozó- 
kat, függvényeket tartalmazhat, amelyek kezelésére további technikák (pl. változók standar- 
dizálása, Skolemizálás, prenex formára hozás, egyesítés/unifikáció) alkalmazása szükséges. 
Ezekről az érdeklődő olvasó a [17] és [11] irodalmakban talál részletes leírást. 

A 4.3.3. példa folytatása: A va(P(x) — 0(2)) A P(a) A -—0(a) formula kielégíthetetlen- 
ségének igazolásához a formula klózhalmazából indulunk ki, amely a következő: 

C1 : aP(x) v 0(2) 

CC HŐN Hl (a) 

C3 : a9(a) 

(Megjegyzés: Ci klózban minden objektumváltozót univerzális kvantor köt, de ezt nem 
jelöljük.) 


A C1, C2, Cz klózhalmaz kielégíthetetlenségének igazolása indirekt bizonyítással történik: 
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Tegyük fel, hogy minden klóz igaz: 
C; igaz, ha P(a) —T 
C3 igaz, ha 0(a) — F 


C1 igaz, ha minden x esetén vagy P(x) — F vagy 0(2) — T (ez ellentmond C és Cs 





igazságáról tett megállapításainknak.) 











A 4.3.1. példa folytatása: A formulákból kialakított klózhalmaz a következő: 


C4 : H(a) (F.-ből, ahol a Skolemizálással kapott konstans) 


C2 : Ely) v F(a,y) — (F:-ből, ahol a Skolemizálással kapott konstans) 


C3 : AE(2) v -—U(2) V -H(2) v -F(y,2) — (F2-ből) 


C4 : E(b) (-F3-ból, ahol b Skolemizálással kapott konstans) 
Cs : U(b) (-F3-ból, ahol b Skolemizálással kapott konstans) 


A tételbizonyítás lépéseit, az üres klóz (NIL) levezetését a 4.3. ábrán látható rezolúciós gráf 
mutatja (a gráf élein az úgynevezett változóillesztések láthatók). Ezzel igazoltuk, hogy az F3 





formula logikai következménye Fi és F? formuláknak. 











4.3. ábra. A bizonyítási eljárás szemléltetése 


C : H(a) ee : -E(x) V-U(x) V-H(a,x) 







C,: —E(y)VE(a,y 
LÉ GÁeksszsá s See 


C,: E(b) 


(Megjegyzés: A fejezethez tartozó gyakorló feladatok a 


eti -E(b)V-E(a,b) 
5 U) 


NIL 


-F(a,b) 


Tetelbizonyitas az iteletkalkulusban feladatok.pdf fájlban találhatók.) 
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5. fejezet 


Bizonytalanságkezelés 


5.1. Alapok 


Az intelligens problémamegoldás során használt szimbolikus adatok gyakran közelítőek, 
pontatlanok, bizonytalanok. Ezért rendszereinket olyan technikákkal kell ellátnunk, amelyek 
segítségével bizonytalan, hiányos, nehezen formalizálható vagy ellentmondásos ismeretek 
esetén is racionális döntések meghozatalára képesek. 

A bizonytalanság oka többféle lehet.  Eredhet egyrészt a világ bizonyos részeinek 
, elrejtéséből", amelynek eredete lehet hiányos tudás, biztos, de nem megfigyelhető vagy még 
be nem következett adat. Másrészt tudásunk lehet nem teljesen megbízható akár egy hibás 
mérési adat vagy bizonytalan fogalom miatt. Problémát okozhat továbbá a nem elég precíz 
reprezentáló nyelv használata miatti bizonytalan fogalmak, valamint az ellentmondásos tudás 
kezelése. 

A bizonytalanság kezelése felveti azokat a kérdéseket, hogy hogyan reprezentáljuk a 
bizonytalan információt, hogyan adjuk meg a bizonytalan állítások megbízhatósági mértékét, 
hogyan kezeljük összetett állítások, kifejezések bizonytalanságát, valamint hogyan következ- 
tessünk bizonytalan információ esetén. 

A bizonytalanság kezelésére alkalmas módszereket a következőképpen csoportosíthatjuk: 


. Valószínűségszámítási módszerek (numerikus módszerek) 


Ezek lényege, hogy minden rendszerelemhez (adathoz, fogalomhoz, eljáráshoz) egy, a 
bizonytalanságot kifejező számértéket rendelnek, az AND, OR és NOT műveletekkel 
összekapcsolt rendszerelemekhez, valamint a kövezkeztetésekhez kombinációs függ- 
vényeket definiálnak. 


— Bayes-modell 
Alapja a klasszikus valószínűségszámítás, amely jól definiált események előfor- 
dulásának valószínűségével foglalkozik, ezt számértékkel jellemzi. 

— Bayes-hálók 
Alapja a klasszikus valószínűségszámítás. Az események oksági kapcsolatainak 
szerkezetét irányított gráffal reprezentálja, majd a valószínűségszámítás konkrét 
módszereit használja. 
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— Fuzzy modell 
Pontatlan, gyengén definiált, úgynevezett fuzzy halmazokkal és az ezekhez 
kapcsolódó fuzzy logikával foglalkozik. 

— Heurisztikus modellek 


Formailag az előzőekhez hasonlítanak, azonban elméletileg nem megalapozottak. 
Legismertebb képviselőjük a MYCIN modell (bizonyossági tényező modell), 
amely egy orvosi szakértői rendszer bizonytalanságkezelő modellje. 


e Nemmonoton logikák (szimbolikus módszerek) 


Ezek lényege, hogy a hiányos ismereteket feltételezésekkel, hiedelmekkel helyettesítik, 
amelyek ellentmondás esetén visszavonhatók. 


A következő fejezetek a Bayes-modellt, a Bayes-hálót és a fuzzy modellt mutatják be. 


5.2. Bayes-modell 


A valószínűségszámítási feladatok véletlen kísérletek kimeneteleivel foglalkoznak (pédául 
mi a valószínűsége, hogy egy dobókockával hatost dobunk). Egy kísérletet elvégezve annak 
lehetséges kimenetelei az elemi események, amelyek összessége alkotja az eseményteret, 
amelynek jele az (2? (például a kockadobás eseménytere: 2 — (1,2,3,4,5,6h. Az 
eseményeket (2 részhalmazaiként értelmezzük, s minden eseményhez egy nulla és egy közötti 
számot, az esemény valószínűségét rendelünk. 


A valószínűségi mérték (P) tulajdonságai a következők: 
" 0 c P(A) £ 1 (egy A esemény valószínűsége 0 és 1 közé esik) 


e P(N) — I (a biztos esemény valószínűsége 1) 


P(0) — 0 (a lehetetlen esemény valószínűsége 0) 
: P(AU B) — P(A) -- P(B) (amennyiben A és B egymást kizáró események) 


. P(AU B) — P(A) -- P(B) — P(An B) (amennyiben A és B nem egymást kizáró 
események). 


A feltételes valószínűség azt fogalmazza meg, hogy mennyi A esemény bekövetkezésének 
a valószínűsége abban az esetben, ha tudjuk, hogy B bekövetkezett. Azaz A esemény 
bekövetkezését mennyire befolyásolja B bekövetkezése (például mi a valószínűsége annak, 
hogy hatost dobunk a kockával, feltéve, hogy párosat dobunk). 


A feltételes valószínűség definíciója: 


P(An B) 


BAJA á 


P(B)50 
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Az egyenlet átrendezésével az úgynevezett szorzatszabályt kapjuk: 
P(An B) — P(AIB)P(B) 


B esemény bekövetkezésének valószínűségét A bekövetkezése esetén a feltételes valószínű- 
ség definíciója alapján a következőképpen adhatjuk meg: 


P(An B) 


P(BIAJ- Sa 


P(A) 50 


Az egyenlet átrendezésével kapott szorzatszabály: 
P(An B) — P(BIA)P(A) 
A szorzatszabályok bal oldalainak azonosságát felhasználva a Bayes-tételhez jutunk: 


P(BIAJR(A) 


P(AlBY- ERT? 


P(B) 50 


Az egyenlet átrendezett alakjából 


P(AlB)  P(BIA) 


P(A)  P(B) 
látható, hogy a tétel szimmetrikus, azaz A és B események között nincs oksági irány, akár 4, 
akár B lehet ok vagy okozat. 





Ha egy 2 — (4:, 42, . . . An) teljes eseményrendszert vizsgálunk (azaz az események 
páronként kizárják egymást és uniójuk a biztos esemény), ahol P(A;) 5 0 minden i-re, akkor 
bármely további 8 esemény esetén 


P(B) — 3 , P(BIAJP(A) 


Ezt felhasználva a Bayes-tétel általánosítása a következő: 


P(BIA)P(A:) 


DE FGSMAET 





P(A:1B) E 


A Bayes-tétel segítségével következtetni lehet B eseményből A; esemény feltételes vagy 
, kikövetkeztetett" vagy a posteriori valószínűségére. Ehhez azonban ismerni kell a P(A;) 
valószínűségi értékeket és a P(BIA;) feltételes valószínűségeket. 


Példa: Egy település lakosságának 2090-a gyerek, 3090-a időskorú, 5090-a pedig aktív korú 
felnőtt. A gyermekek 0.3, az aktív korú felnőttek 0,1, az időskorúak 0.4 valószínűséggel 
kapják el az influenzát egy nagy járvány idején. Mi a valószínűsége, hogy egy kiválasztott 
influenzás beteg gyermek? Másképpen megfogalmazva: mi a valószínűsége, hogy a 
kiválasztott lakos gyermek, feltéve, hogy influenzás? P(GyI/I) 
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I: a kiválasztott lakos influenzás (evidencia) 
Gy: a kiválasztott lakos gyermek (evidencia) 


A következő adatokat ismerjük: 


P(Gy) — 0.2 (alakos gyermek) 

P(ID) — - 03 (alakos időskorú) 

P(F) — 0,5 (alakos aktív korú felnőtt) 

P(IIGy) - 0.3 (alakos influenzás, feltéve hogy gyermek) 
P(IIID) - 04 (alakos influenzás, feltéve hogy időskorú) 

P(IIF)  - 01 (alakos influenzás, feltéve hogy aktív korú felnőtt) 


A Bayes-tétel alkalmazása a feladatra: 


P(IIGy)P(Gy) 
(IIGy)P(Gy) 4 P(IIID)P(ID) -- PCIIF)P(F) 





P(GyID — — 


A konkrét valószínűségi értékek behelyettesítésével: 


0,3 x 02 


tény 03402104X03101x05 


0,26 





Tehát annak valószínűsége, hogy a lakos gyermek, feltéve, hogy influenzás: P(GyII) — 
0,26.a 


A Bayes-modell alkalmazásának előnye, hogy szilárd elméleti alapokon (valószínű- 
ségszámítás) nyugszik, s jól definiált szemantikával rendelkezik. Hátránya, hogy nagy 
mennyiségű háttér ismeretet (a priori valószínűségek, feltételes valószínűségek) kell megadni 
a használatához, amelyek közül nem hiányozhat egy sem. Ezeket az a priori valószínűségeket 
nehéz megadni, meghatározásuk statisztikai mintavételezéssel történik, ami sok munkát, 
kísérletet jelent. Hátránya továbbá, hogy a tárgyterület változásainak követése nehéz, új 
bizonyíték, új hipotézis esetén a rendszer bővítése nem inkrementális, valamint a kiszámolt 
valószínűségek nem magyarázhatóak. 


5.3. Bayes-hálók 


A statisztikai adatokon alapuló Bayes-modell az oksági kapcsolatok irányáról nem nyújt 
információt. Az oksági modellek reprezentálására a Bayes-hálók (más néven vélekedéshá- 
lók) használhatók, amelyek egyrészt megjelenítik a valószínűségi paramétereket, másrészt 
lehetővé teszik a változók között függőségi kapcsolatok ábrázolását. 

A Bayes-háló egy irányított körmentes gráf, amelynek csomópontjai állításokat, esemé- 
nyeket reprezentálnak, élei pedig ezek közvetlen ok-okozati kapcsolatait írják le. A háló 
nemgyökér csomópontjaihoz rendelt feltételes valószínűségi táblák (lásd az 5.1. ábrát). 

A Bayes-hálók a következőképpen használhatók következtetésre: 


e hatásokból az okokra történő következtetés (diagnosztizálás) 
pl. a köhögés közvetlen oka lehet hörghurut, amelynek közvetlen oka lehet dohányzás 


— így a köhögést okozhatja dohányzás 
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T Í 0.30 
F 1 0.001 





Torokfájás 






5.1. ábra. Bayes-háló 


e hatásokra oksági alapon történő következtetés 


pl. influenza miatt a betegnek fájhat a torka, ami miatt köhöghet 


e kölcsönös oksági kapcsolat alapján történő következtetés 


pl. a köhögés oka lehet a torokfájás és a hörghurut 


A kikövetkeztetett események valószínűségének meghatározása a Bayes-modell alapján 
történik. A Bayes-hálók a következtetések mellett használhatók a kapott eredmények 
indoklására, magyarázatadásra is. 


5.4. Fuzzy logika 


A mindennapi életben számtalanszor előfordul, hogy nem tudjuk bizonyos dolgokról ka- 
tegorikusan eldönteni, hogy igazak vagy hamisak, adott halmazba tartoznak-e vagy sem. 
Próbáljuk meg definiálni például a , magas emberek" halmazát! A klasszikus halmazelmélet 
szerint ebben az esetben meg kellene adnunk azt a magasság értéket (pl. 180 cm), amelynél 
kisebb emberek egyike sem eleme a halmaznak, a többiek pedig elemei. Ez a fajta éles 
szétválasztás azonban a példa esetében erőltetett, hiszen egyrészt a határérték megválasztása 
szubjektív, másrészt például egy 179,9 cm-es ember már nem tartozna a , magas emberek" 
halmazába. Ezért az ilyen típusú fogalmak esetében a gyakorlati életben bizonytalanságot 
kifejező szavakat (pl. többé-kevésbé, talán, lehet) használunk. 

A fuzzy angol szó magyar jelentése homályos, ködös, életlen, bizonytalan. A folytonos 
értékkészletű fuzzy logika szükségességét és az ehhez kapcsolódó fuzzy halmazok elméletét, 
amely a klasszikus halmazelmélet kiterjesztésének tekinthető, Lofti Zadeh fogalmazta meg 
az 1960-as években. A nyelvi fogalmakban levő bizonytalanság matematikai kezelésére 
megalkotta a parciális tagság fogalmát, amely azt fejezi ki, hogy egy adott objektum 
mennyire van benne egy adott halmazban. 
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A halmazhoz tartozás mértéke úgynevezett tagsági függvénnyel adható meg a követke- 
zőképpen: 
Ha(x) : U — [0,1] 
ahol: 
u : tagsági függvény 
U : alaphalmaz, univerzum 


A C U : fuzzy halmaz 
x € U : az alaphalmaz eleme 


Az 5.2. ábra egy közönséges (éles) és egy fuzzy halmazt mutat be. 


1 1 


5.2. ábra. Éles és fuzzy halmazok 


Amennyiben 44(x) — 1: x definit módon A halmazba tartozik, ha ua(T) — 0: x definit 
módon nem tartozik 4 halmazba. ua(xi) 5 Ha(lx2) esetén zi , jobban beletartozik" A 
halmazba, mint 27. 

A fuzzy halmazok az 5.3. ábrán látható módon különböző típusú tagsági függvényekkel 
írhatók le (az ábra a MATLAB? [16] Fuzzy Logic Toolbox segítségével készült). A 
fuzzy halmazok nemcsak folytonos univerzumon értelmezhetők. Amennyiben az univerzum 
diszkrét elemekből áll, egy 4 fuzzy halmaz (x;, ua(x;)) párokból álló tagsági függvénnyel, 
úgynevezett singletonokkal adható meg. 


A fuzzy halmazokon is értelmezhetők az alapvető halmazelméleti műveletek a következő 
módon (lásd 5.4. ábra): 


Azonos univerzumon értelmezett fuzzy halmazok uniója: 

HauB(T) — max(Ha(T), uB(T)j 
Azonos univerzumon értelmezett fuzzy halmazok metszete: 

HanB(T) — mirÁína(r), up(z)j 
Fuzzy halmaz komplemense: 

H-a(z) — 1— 1a(z) 

A bemutatott alapműveleteken kívül további műveletek, például fuzzy relációk, fuzzy 
kompozíciók is értelmezhetők. Az érdeklődő olvasó erről részletesebben a [15] elektronikus 
tankönyvben olvashat. 


A fuzzy halmazok és az ezeken értelmezhető műveletek segítségével bonyolultabb 
rendszerek is leírhatók, működtethetők. Legfontosabb gyakorlati alkalmazási területei a 
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5.3. ábra. Fuzzy tagsági függvény családok 


5.4. ábra. Fuzzy halmazokon értelmezett műveletek 
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fuzzy irányító és szakértői rendszerek (szakértői rendszerekről a 7. fejezetben lesz szó), 
amelyekben természetes nyelvi változókkal és fuzzy tagsági függvényekkel kombinált , ha- 
akkor" típusú szabályokkal fogalmazható meg a szakértői ismeret, a gyakorlati tapasztalat. 
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Példa: Egy irányító rendszerben az alapjeltől való eltérés (hiba) és a beavatkozás univerzu- 


aa 


mon értelmezzük a , negatív", a , zéró" és a , pozitív" fuzzy halmazokat. A fuzzy halmazok 
a MATLAB$ [16] Fuzzy Toolbox segítségével készített 5.5. ábrán láthatók. 
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5.5. ábra. Fuzzy halmazok 


Legyenek a fuzzy szabályok a következők: 


1. Ha hiba — negatív akkor beavatkozás — negatív 
2. Ha hiba — zéró akkor beavatkozás — zéró 
3. Ha hiba — pozitív akkor beavatkozás — pozitív 


A fuzzy következtetés lépései az 5.6. ábrán láthatók. A szabályozott rendszertől érkező 
bemeneti változó értékéről (hiba — -0,4) meghatározzuk, hogy ez mennyire tartozik a hiba 
univerzumon értelmezett fuzzy halmazokba. Ez a lépés a fuzzifikálás. Látható, hogy 
fuzzifikált értéknek az 1. és a 2. szabályok feltételi részével van nemüres metszete, ezért 
ezek a szabályok alkalmazhatók a következtetés során (lásd ábra bal oldala). Az egyes szabá- 
lyokkal meghatározott következtetések eredményei az ábra jobb oldalán láthatók, amelynek 
legalsó részábrája a három szabály általi következtetések unióját mutatja. A következtetés 
eredményeként, a beavatkozás értékére kapott fuzzy halmaz átalakítása után továbbíthatjuk 
a szabályozott rendszer felé a beavatkozó jelet. Az átalakítás különböző defuzzifikációs 
módszerek (pl. súlypont módszer, geometriai középpont módszer) alkalmazásával történhet. 


(Megjegyzés: A fejezethez tartozó feladat az FLMatlab.pdf fájlban található.) 
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5.6. ábra. Fuzzy következtetés 
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6. fejezet 


Tudásalapú rendszerek 


6.1. Alapok 


A mesterséges intelligencia kutatások első korszakában (60-as évek) kidolgoztak egy általá- 
nos célú problémamegoldó keretet, a GPS-t (General Problem Solver), amely a feladat adott 
kezdeti állapotából kiindulva műveletek egymás utáni alkalmazásával próbált meg eljutni a 
megoldást jelentő célállapothoz. A rendszer szisztematikus módon, a lehetséges utak vakon 
történő bejárásával (lásd 3. fejezet, keresések) dolgozott, amely nagyméretű, bonyolult 
feladatok esetén a kombinatorikus robbanás problémája miatt nem lehetett eredményes. 

A kutatók felismerték, hogy szűkített feladatosztályok megoldására speciális technikák 
kifejlesztése szükséges, valamint felismerték a , tudás elvét". Ez utóbbi szerint a feladatmeg- 
oldás képessége attól függ, hogy mennyi és milyen minőségű tárgyterület-specifikus ismeret 
(tudás) áll rendelkezésre. Bebizonyosodott, hogy a nagy méretű és nagy bonyolultságú 
feladatok jobban kezelhetők, ha magát a problémaleírást és annak összefüggéseit ábrázolják 
megfelelően, amely alapján a problémamegoldás egyszerű mechanizmusokkal hatékonyan 
megvalósítható. Így különválik a feladatspecifikus ismeret (tudás) és a végrehajtó mechaniz- 
mus (következtetés). Ezeket a rendszereket tudásalapú (vagy ismeretalapú) rendszereknek 
(angolul knowledge based system) nevezik. 


6.2. Tudásalapú rendszerek jellemzői 


A tudásalapú rendszerek tehát olyan mesterséges intelligencia rendszereknek tekinthetőek, 
amelyek újszerű programstruktúrával rendelkeznek. Ebben a feladatspecifikus ismeretet tar- 
talmazó tudásbázis jól elhatárolódik a rendszer egyéb komponenseitől, így a feladatmegoldást 
végző következtető mechanizmustól 15. 

Ennek megfelelően egy tudásalapú rendszer alapvető komponensei a következők (lásd 
6.1. ábra): 


e Tudásbázis, amely általában természetes nyelvhez közeli formalizmussal leírva tartal- 
mazza a problématerületet leíró ismereteket (tudást). Ez tulajdonképpen szimbolikus 
módon leírt rendszerspecifikáció, amelynek hatékony megvalósításához megfelelő 
tudásreprezentációs módszer szükséges. 
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e Következtető gép, amely a feladatmegoldás , motorja". Ennek megfelően általános 
problémamegoldó ismereteket, megoldáskereső stratégiát tartalmaz, amelyet kiegészít- 
hetünk egyéb szolgáltatásokkal is. Fő jellemzője a megoldáskereső módszer. 


e. Munkamemória, amely egy kisegítő komponens a konkrét feladat kiinduló, valamint 
közbülső adatainak tárolására. 


Előfordul, hogy a tudásbázis részeként tekintik a munkamemóriát, szerepük alapján 
azonban érdemes megkülönböztetni az adott típusú problémákra jellemző feladatspecifikus 
tudást (amely állandó és erősen összefüggő), valamint konkrét esetre vonatkozó tudást (amely 
a következtetés során, esetleg az időben is változik). 











Tudásbázis 





Kidárenőé 





Következtető 
gép 











6.1. ábra. A tudásalapú rendszer alapvető komponensei 


Egy tudásalapú rendszer intelligens információfeldolgozó rendszerként tekinthető, amely- 
ben a tárgyköri ismeretek ábrázolása természetes nyelvhez közeli formalizmussal, szim- 
bolikus módon történik. A feladatmegoldás a tudásbázisban tárolt ismeretdarabkák moz- 
gósításával, szimbólum-manipulációval történik, ezért ezeket a rendszereket szimbolikus 
programoknak is nevezik. 


6.2.1. Tudásreprezentációs módszerek 

A tudásbázis az adott problémára, tárgykörre vonatkozó specifikus ismeretek szimbolikus 
leírását tartalmazza valamilyen tudásreprezentációs eszközzel megvalósítva. A tudásbázisú 
rendszerek elkészítésekor feladatunk az ismeret megszerzése, , kinyerése", az ismeret ábrázo- 
lása, reprezentálása, és az ismeret hasznosítása, azaz feladatmegoldásra való felhasználása. 
Ezen feladatok megvalósításához elengedhetetlenül szükséges egy megfelelő leíró eszköz 
(szintaxis) és az elemek jelentését meghatározó szemantika (pl. következtető módszer). 


A reprezentációs módszereket a következőképpen osztályozhatjuk: 


e A problémaleírás módja szerint: 
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— procedurális/ algoritmikus reprezentáció 


azaz arra a kérdésre adjuk meg a választ, hogy HOGYAN oldjuk meg a feladatot. 


— leíró/ deklaratív reprezentáció 


Ekkor magát a problémát írjuk le, azaz, hogy MIT kell megoldanunk. Ebben az 
esetben a feladatmegoldást a következtető rendszer végzi. Ezeket logika alapú 
leírásoknak is nevezzük. 


Tudásalapú rendszereknél jellemzően deklaratív leírást alkalmaznak, amely szükség 
esetén kiegészíthető hatékonyságnövelő algoritmikus elemekkel (pl. démonokkal, 
metaszabályokkal) 


e A problémaleírás szerkezete szerint: 


— egyszetű/ elemi reprezentáció 
Ezek egyszerű, struktúra nélküli elemek, valamint ezek kapcsolatait, a rajtuk 
elvégezhető műveleteket tartalmazzák. Leggyakrabban logika alapú rendszerek. 
— strukturált reprezentáció 


Ebben az esetben belső struktúrával, attribútumokkal rendelkező objektumokkal 
dolgozunk, ahol az objektumok kapcsolata lehet taxonomikus vagy osztályozó 
hierarchia. Gyakran keretalapú rendszerekkel valósítják meg. 


6.2.2. Megoldáskereső módszerek 


A következtető gép a tudásbázison működő megoldáskereső stratégia implementációja. A 
keresés a 3. fejezetben bemutatott általános problémamegoldó mechanizmus, amely az 
állapottér szisztematikus bejárásával oldja meg a feladatot. A lehetséges akciók közötti 
választás módját meghatározza a keresési stratégia. Ez kiegészíthető a feladatról szóló extra 
tudással, a heurisztikus ismeretekkel, amelynek figyelembe vétele a keresés hatékonyságát 
jelentősen növelheti, azonban az esetek többségében jól alkalmazható heurisztikát nem 
könnyű találni. 


A keresési stratégiákat a következőképpen osztályozhatjuk: 
e Felhasznált ismeretek alapján 


— Véletlenszerű keresés, amelynél nem biztosított a véges időn belüli célbaérés. 


— Vak keresések (neminformált keresések), amely teljes körű szisztematikus bejá- 
rást biztosít, azonban nem ad információt az út/csúcs , jóságáról". Az algoritmus 
csupán a cél és nemcél csúcsokat különbözteti meg. 


— Hevurisztikus keresések (informált keresések), amely feladatspecifikus heuriszti- 
kus ismeretek felhasználásával ad becslés az út/csúcs , jóságáról". 


" Módosíthatóság alapján 


oO Piglerné Lakner Rozália, Starkné Werner Ágnes, PE www.tankonyvtar.hu 


48 


6. TUDÁSALAPÚ RENDSZEREK 





— Nem-módosítható vezérlési stratégiák, amelyek esetén a kiválasztott akció nem 
vonható vissza, másik alkalmazható akció kipróbálására nincs lehetőség, azaz 
minden lépés végérvényes. 

— Módosítható vezérlési stratégiák, amelyek felismerik a hibás vagy nem megfelelő 
akciókat. Az algoritmus egy korábbi állapotba lép vissza, ha olyan végállapotba 
ér, amely nem célállapot vagy az adott irány nem tűnik ígéretesnek. 


6.2.3. Az ismeretalapú rendszerek alaptechnikái 


Az ismeretalapú rendszerekben megvalósított tudásreprezentációs módszerek és következte- 
tési és keresési stratégiák szerint az alábbi alaptechnikákat különböztetjük meg: 


6.3. 


Induktív technikák 

Az induktív következtetés a gépi tanulás problémakörébe tartozó módszer, amely 
során egyedi esetekből (tanulási példákból) általános érvényű következtetések levonása 
történik. Erről részletesebben a 8. fejezetben esik szó. 

Szabályalapú technikák 


A leggyakrabban alkalmazott tudásalapú rendszer alaptechnika, amely HA-AKKOR 
szerkezetű szabályok alaján adat- vagy célvezérelt következtetést valósít meg. Ezt a 
módszert a 6.3. fejezet mutatja be. 


Hibrid technikák 


Többféle alaptechnika együttes használatát biztosítja, leggyakrabban szabályokat és 
keret-struktúrákat alkalmaz. 


Szimbólum-manipulációs technikák 


A tudásalapú rendszerek működése szimbólum-manipulácival történik, ezért leírásukra 
a mesterséges intelligencia programnyelvei, pl. LISP, Prolog is használhatóak. 


További következtető technikák 


— modell-alapú következtetési technikák 
kvalitatív technikák 


eset-alapú technikák 


temporális következtetési technikák 


neurális hálózatok. 


Szabályalapú következtetés 


A szabályalapú reprezentáció a legkorábban kialakult, s egyszerűsége és hatékony megva- 
lósíthatósága miatt a ma is leggyakrabban alkalmazott tudásreprezentációs módszer. Tény- 
állítások és HA-AKKOR típusú feltételes állítások írhatók le segítségükkel, amely az emberi 
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gondolkodásmód modellezésére, a szakértői tapasztalatok, heurisztikák megfogalmazására 
alkalmas. 


Egy szabály egy ismeretdarabkát reprezentál 


HA cfeltétels AKKOR ckövetkezményz 


vagy 
IF cfeltétels THEN ckövetkezményz 


alakban, ahol a feltétel a szabály alkalmazásának előfeltételeit, a következmény pedig a végre- 
hajtásának hatását adja meg tények (predikátumok) vagy tényekből ÉS/VAGY műveletekkel 
előállított kifejezések formájában. 

Egy szabályalapú rendszer működése kétféle következtetési stratégia alapján történhet. 
Az adatvezérelt (vagy előrefelé haladó) következtetés során feladat egy kezdőállapotból 
kiindulva egy megoldást jelentő célállapot elérése vagy megkonstruálása. A célvezérelt 
(vagy visszafelé haladó) következtetés esetén a feladat egy feltételezett célállapot igazolása 
kezdetben érvényes tényekre támaszkodva. 

A szabályokat mindkét esetben a következtető gép működteti új ismeret vagy információ 
levezetése céljából. Egy elemi következtetési lépés egy szabály alkalmazását jelenti, amely 
a következő részlépésekből áll: 


1. Mintaillesztés 


Ebben a részlépésben a következtető gép mintaillesztéssel megkeresi az alkalmazható 
szabályokat, majd a végrehajtható szabályokat egy úgynevezett konfliktushalmazba 
teszi. 


2. Szabály kiválasztása konfliktusfeloldás 


A következtető gép beépített vezérlési stratégiája alapján a konfliktushalmazban levő 
szabályok közül választ egyet. 


3. Szabály alkalmazása 


A következtető gép a kiválasztott szabályt végrehajtja. Ezt a lépést más néven a szabály 
tüzelésének nevezzük. 


A következtető gép ezt 3 részlépésből álló elemi következtetési lépést ismétli ciklikusan 


a leállási feltétel bekövetkezéséig vagy amíg nincs több alkalmazható szabály. 


6.3.1. Adatvezérelt következtetés 


Az adatvezérelt következtetés lépései a következők: 


1. A mintaillesztés a munkamemória tartalma és a szabályok feltételi része között történik 
a modus ponens levezetési szabály alkalmazásával (lásd 4.2.3. fejezet). 


2. A szabály kiválasztása/konfliktusfeloldás egy tetszőleges konfliktusfeloldó statégia 
alapján történik. 
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3. A szabály alkalmazása során a kiválasztott szabály következmény részének alkalma- 
zása/igazzá tétele történik. 


6.3.1. példa: Tekintsük a következő szabályokat: 


RI IF A(X) and B(Y) THEN C(Xx) 
R2 IF C(X) and D(TY) THEN P(X) 
R3 IF D(X) and not E THEN P(X) 


A munkamemória tartalma legyen: 4(a), B(b), D(d), 
ahol 4, B, C, D, E, P predikátum szimbólumok, X és Y változók, a, b és d konstansok. 
Az adatvezérelt következtetés lépései a következők: 
e A munkamemória tartalmára illeszkedő szabályok: R/ X-a és Y-b illesztéssel, 


valamint R3 X-d illesztéssel. A végrehajtható szabályok közül R/-t alkalmazva a 
munkamemóriába bekerül Cra). 


A munkamemória tartalma: 4(a), B(b), D(d), C(a). 


Az alkalmazható szabályok: R/ X—a és Y-b illesztéssel, R2 X—a és Y-d illesztés- 
sel, valamint R3 X-d illesztéssel. (A vezérlés ciklusmentesítésére a továbbiakban 
az ugyanazzal az illesztéssel korábban már alkalmazott szabályokat ismételten nem 
hajtjuk végre, ezért R/-t nem végrehajthatónak tekintjük.) R2 szabály alkalmazásával 
a munkamemóriához adjuk P(a)-t. 


A munkamemória tartalma: 4(a), B(b), D(d), C(a), Pra). 


A végrehajtható szabály: R3 X-d illesztéssel. Ezt végrehajtva P(d) a munkamemóriába 
kerül. 


A munkamemória tartalma: 4A(a), B(b), D(d), C(a), P(a), P(d). 


e. Nincs több alkalmazható szabály. 


Az adatvezérelt következtetés lépéseit a 6.2. ábra illusztrálja. 


6.3.2. Célvezérelt következtetés 


Célvezérelt következtetésnél feladatunk egy célállapot igazolása, amelynek lépései a követ- 
kezők: 


1. A mintaillesztés egy igazolandó cél és a szabályok következmény része között történik a 
modus ponens levezetési szabály (lásd 4.2.3. fejezet) , fordított irányú" alkalmazásával. 
Ez alapján az alkalmazható szabályokat a konfliktushalmazba tesszük. 


2. A szabály kiválasztása konfliktusfeloldás az elsőként alkalmazható szabály kiválasztá- 
sával történik. 


3. A szabály alkalmazása során a kiválasztott szabály feltételi részében szereplő állítások 
lesznek az új részcélok. 
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R1: If A(X) and B(Y) then C(X) 


R2: If C(X) and D(Y) then P(X) 


R3: If D(X) and not E then P(X) 





P(a) (2.) 


hozzáadása 





illesztés 





P(d) (3.) 


hozzáadása 





illesztés 





6.2. ábra. Az adatvezérelt következtetés lépései 


A következtető gép ezeket a lépéseket ismétli ciklikusan az összes részcél igazolásáig, 
vagy amíg nincs több alkalmazható szabály. Célvezérelt következtetésnél zsákutca esetén 
(amennyiben az adott állapotban nincs több alkalmazható szabály), visszalépést alkalmazva 
lehetőség van új irányok kipróbálására. 


6.3.1. példa folytatása: A szabályhalmaz és a munkamemória kezdeti állapotának ismereté- 
ben célvezérelt következtetés során feladatunk P(2) igazolása (ahol Z változó). Ennek lépései 
a következők: 
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e A P(2) célra illeszkedő szabályok: R2 Z7—X illesztéssel, valamint R3 7—X illesztéssel. 
A végrehajtható szabályok közül a továbbiakban az első megtalált szabályt alkalmaz- 
zuk. R2 végrehajtásával C(2) és D(7T) új részcélok lesznek. 


— C(X) részcél igazolására alkalmazható szabály: R/ X-X illesztéssel, amelynek 
alkalmazásával 4(X) és B(Y) lesznek az új részcélok. 
k A(X) részcél igaz, mert a munkamemóriában megtalálható X—a egyesítéssel. 
k B(T) részcél igaz, mert a munkamemóriában megtalálható Y-—b egyesítéssel. 
kt Mivel igazoltuk 4A(a)-t és B(b)-t, igazoltuk Cra)-t. 
— D(7) részcél igaz, mert a munkamemóriában megtalálható Y—-d egyesítéssel. 
— Mivel igazoltuk Cr(a)-t és D(d)-t, igazoltuk P(a) célt. 

e Amennyiben célunk az összes megoldás előállítása, az első lépésre visszalépünk és a 
P(2) célra illeszkedő szabályok közül R3-t alkalmazzuk. Ebben az esetben D(X) és 
not(E) lesznek az új részcélok. 

— D(X) részcél igaz, mert a munkamemóriában megtalálható X—d egyesítéssel. 
— not(E) részcél igaz, mert E nem szerepel a munkamemóriában. 


— Mivel igazoltuk D(d)-t és not(F)-t, igazoltuk P(d) célt. 


A célvezérelt következtetés lépései a 6.3. ábrán láthatóak. 
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R1: If A(X) and B(Y) then C(X) 
R2: If C(X) and D(Y) then P(X) vdástATB Cél P(Z) €... 


R3: If D(X) and not E then P(X) 
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6.3. ábra. A célvezérelt következtetés lépései 
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7. fejezet 


Szakértői ágens 


7.1. Alapok 


A szakértői rendszer olyan szoftver ágens, amely a felhasználó kérdéseire az emberi 
szakértőhöz hasonlóan javaslatot, tanácsot vagy valamilyen konkrét értékelést szolgáltat. Egy 
szűk szakterület ismereteit magába foglalva, különböző mesterséges intelligencia technikákat 
felhasználva az emberi problémamegoldás folyamatát modellezi. 

A szakértői rendszerek fejlesztésével és használatával célunk, hogy a szakértő(k) is- 
mereteit tárolva viszonylag gyors problémamegoldást biztosítsunk az emberi tényezőktől 
független módon. Alkalmazásukkal egy feladatot kevesebb emberrel és/vagy kevesebb idő 
alatt oldhatunk meg, a szakértői javaslatok figyelembe vételével a hibás döntések száma 
csökkenthető. 


7.2. Szakértői rendszer 


A szakértői rendszerek olyan tudásalapú rendszereknek (lásd 6. fejezet) tekinthetők, amelyek 
szakértői szintű ismeretek felhasználásával magas szintű teljesítményt nyújtanak egy szük 
problémakör kezelésében. 


Szakértői rendszerek alkalmazása abban az esetben lehetséges, ha a megoldandó feladat az 
alábbi jellemzőkkel rendelkezik: 


e szűk problématerületet ír le 

e ennek ellenére elég bonyolult, azaz igény van szakértelemre 

e emberi szakértők rendelkezésre állnak 

e legalább a szakterület alapkérdéseiben egyetértés van a szakértők között 

e tanpéldák, alapadatok rendelkezésre állnak a rendszer elkészítéséhez és teszteléséhez 


e előny továbbá, ha a feladat részproblémákra osztható. 
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A problémamegoldás folyamata az emberi problémamegoldáshoz hasonló módon, a szak- 
értői szintű ismeretek (tudásdarabkák, sémák, ökölszabályok) tudáselemeinek szituációfüggő 
mozgósításával történik, amelynek eredménye magyarázattal ellátott szakértői szintű javaslat, 
tanács. Ez alapján a szakértői rendszer egy intelligens információfeldolgozó rendszerként 
tekinthető. 

A szakértői rendszereket alapvetően két csoportba sorolják: lehetnek döntéshozó és dön- 
téstámogató rendszerek. A döntéshozó rendszerek általában a problématerületen kevésbé 
járatos felhasználónak nyújtanak segítséget egy adott probléma megoldásának megkeresésé- 
ben. A döntéstámogató rendszerek a felhasználó számára megfontolandó alternatívákat, 
javaslatokat kínálnak fel és a megoldás elemzéseként ehhez fűződő magyarázataikkal segítik 
a felhasználót a döntéshozatalban. 

Ennek megfelelően egy szakértői rendszertől az elvárásaink (a szakértőtől elvártakhoz 
hasonló módon) a következők: 


e adjon javaslatot 
e. megadott javaslatait szükség esetén indokolja 


e természetes nyelven (kérdés/válasz formájában) kommunikáljon a felhasználóval, le- 
gyen , egyenrangú beszélgető partner" 


e feltett kérdéseit szükség esetén magyarázza meg 
e bizonytalan szituációban is elfogadható javaslatot adjon. 


Az itt felsorolt tulajdonságok biztosításához a szakértői rendszer az alábbi komponenseket 
tartalmazza: 


Tudásbázis 


A feldolgozandó problématerület szakértői szintű ismereteit tárolja a tudásdarabkák 
szimbolikus leírására alkalmas reprezentációs technika felhasználásával. 


Következtető gép 


A tudásbázis ismereteit felhasználva, valamint a hiányzó ismereteket a felhasználótól 
bekérve új ismereteket határoz meg. A következtető rendszer által nyújtott feladat- 
megoldás eredménye szakvélemény, javaslat vagy értékelés. A problémamegoldáshoz 
megoldáskereső stratégiával rendelkezik, valamint támogatja a többi komponens mű- 
ködését. 


Munkamemória 


Specifikus információt, a külvilágból érkező és onnan kért adatokat, valamint a 
következtetések során kapott ismereteket tartalmazza. 


Magyarázó alrendszer 


A rendszer akcióit, javaslatait magyarázza meg felhasználói kérésre. 
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Tudásbázis kezelő/fejlesztő alrendszer 


A komponens a tudásbázis építését, tesztelését és módosítását segíti. 


Felhasználói felület 


Természetes nyelvű párbeszédet, konzultációt biztosít a felhasználó és a következtető 
gép között. 


Fejlesztői felület 


A tudásbázis , gazdája", a tudásmérnök, valamint a tárgyköri szakértő hozzáférését 
biztosítja a tudásbázis kezelő/fejlesztő alrendszerhez. 


Speciális felületek 


Adatbázisok elérését és egyéb kapcsolatokat (pl. real-time adatszolgáltatást) valósíta- 
nak meg. 


A szakértő rendszer alapvető komponensei és ezek kapcsolatai a 7.1. ábrán láthatóak. 
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7.1. ábra. A szakértői rendszer alapvető komponensei 


A 6. fejezetben bemutattuk a tudásbázis és a következtető gép fő funkcióit és megvaló- 
sításához alkalmazható technikákat. A következő alfejezetekben a szakértői rendszerek ma- 
gyarázó alrendszerének és tudásbázis kezelő/fejlesztő alrendszerének legfontosabb feladatait 
foglaljuk össze. 


7.2.1. A magyarázó alrendszer 


A magyarázó alrendszer képessége, hogy feladatmegoldás során felhasználói kérésre feltett 
kérdéseihez magyarázatot fűz és információt szolgáltat a következtetés aktuális állapotáról, 
valamint feladatmegoldás után javaslatait indokolja. 

A jellegzetes magyarázatadási módok, a felhasználó által kérhető szolgáltatások a követ- 
kezők: 
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e Magyarázatadás feladatmegoldás közben: 


— WHY ...típusú kérések 
A rendszer magyarázó következtetést végez, amely során az aktuális tudáselemet 
és a hozzá vezető következtetési láncot megmutatva, úgynevezett intelligens 
súgó-help-ként viselkedik. 

— WHAT IF ...típusú kérések 
A felhasználó tesztelheti lehetséges válaszait. Amennyiben számára egy válasz 
következménye kedvezőtlen, lehetőség van annak visszavonására és új lehetőség 
kipróbálására. Ez a szolgáltatás hipotetikus következtetést valósít meg. 

— WHATIS ...típusú kérések 
A felhasználó információt kérhet a tudásbázis és a munkamemória állapotáról. 


e Magyarázatadás, indoklás a feladatmegoldás után: 


— HOW ...típusú kérések 
A felhasználó a rendszer által adott javaslatok elemzéséhez az adott válaszhoz 
vezető következtetési lépéseket, indoklást kérhet. Ez a magyarázatadási mód 
visszatekintő következtetést valósít meg. 

- WHY NOT ...típusú kérések 
Magyarázó következtetés annak ellenpéldákkal történő megkeresésére, hogy 
miért nem a felhasználó által kérdezett eredmény valósult meg. 

— WHATIS ...típusú kérések 


Felhasználói információ kérése a tudásbázis és a munkamemória állapotáról. 


7.2.2. A tudásbázis kezelő/fejlesztő alrendszer 


Egy szakértői rendszer elkészítésének legkritikusabb része az ismeretszerzés és a tudás adott 
formába öltése, amelynek kulcsszereplője a tudásmérnök, aki a tárgyköri szakértővel 
együttműködve dolgozik. A tudásmérnök feldata a tudás beszerzése, megfelelő reprezen- 
tációs technika és következtetési stratégia kiválasztása után a tudásbázis megépítése, annak 
tesztelése, finomítása, módosítása, valamint ellenőrzése és karbantartása. A tudásbázis 
elkészítését a tudásbázis kezelő/fejlesztő alrendszer támogatja. 


A tudásbázis kezelő/fejlesztő alrendszer szolgáltatásai eszközfüggőek, ezek közül néhány 
tipikus szolgáltatás a következő: 


e Eszközök a tudásbázis interaktív fejlesztéséhez: 


— Integrált editor a tudáselemek létrehozásához. Ez általában szöveg editor, amelyet 
a grafikus editor egészíthet ki. 


— Interaktív szövegorientált fejlesztői környezet, amely a tudáselemek szintaktikai 
ellenőrzését is elvégzi. 
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7.3. 


— A tudásbázis vizsgálata, amely megmutatja a megadott tulajdonsággal rendelkező 
tudáselemeket. 


— Dokumentáció készítése a tudáselemekhez. 


— Online help. 
Eszközök nagy méretű tudásbázisok építéséhez és a tudásbázis ellenőrzéséhez: 


— Nyomkövetési lehetőségek a tudásbázis működése során (például tulajdonság- 
értékek megjelenítése, megszakítási pontok generálása). 


— Tudásbázis hierarchikus/moduláris tervezése. 


Tudásbázis particionálása, tudásbázisok összeépítése. 
— Tudáselemek tulajdonság-értékeinek statikus/dinamikus ellenőrzése. 


Tudáselemek szemantikai ellenőrzése. 


Szakértői keretrendszer (shell) 


Az üres tudásbázissal és erőteljes tudásbázis kezelő/fejlesztő alrendszerrel rendelkező tudás- 
alapú rendszereket szakértői keretrendszereknek vagy shell-eknek nevezzük. Fő kompo- 
nenseit a 7.2. ábra mutatja be. Ezek a rendszerek tárgyterülettől független szolgáltatásokat 
nyújtanak szakértői rendszerek létrehozásához és működtetéséhez. Általában támogatják a 
gyors prototípuskészítést és az inkrementális rendszerépítést. Számos ingyenes és keres- 
kedelmi forgalomban levő szakértői keretrendszer érhető el napjainkban, amelyek méreteit 
tekintve PC-ken, munkaállomáson és többfelhasználós nagyszámítógépeken használhatók. 


A szakértői keretrendszereket a következőképpen csoportosíthatjuk: 


Általános célú shellek 


Valamilyen tudásalapú rendszer alaptechnikát (lásd 6. fejezet) megvalósító szoftver 
rendszerek. Ilyen például az adatvezérelt szabályalapú következtetést megvalósító 
CLIPS és JESS, a GENSYM cég terméke, a G2 valós idejű szakértői keretrendszer, 
amely mindkét irányú következtetést támogatja, valamint a keret- és szabályalapú 
programozási technikával rendelkező GoldWorks. A hazai alkalmazások közül ide 
tartozik például a Prolog alapú ALL-EX Plus és MProlog Shell. 


Problémafüggő shellek 


Egy adott problématerület (pl.  diagnosztizálás, rendszer konfigurálás, tevékeny- 
ségtervezés) , kulcsrakész? rendszerei, amelyben a tudásbázist a konkrét feladatra 
vonatkozó ismeretekkel kell feltölteni. Pl. egy hardver konfiguráló rendszer esetén 
a hardverelemekkel kapcsolatos ismereteket kell formalizálni. 


Szakterületfüggő shellek 


Egy adott szakterület (pl. orvosi, jogi terület) alapismereteivel rendelkező rendszerek, 
amelyeket speciális szakismeretekkel kell feltölteni. 
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7.2. ábra. A szakértői keretrendszer alapvető komponensei 


7.4. A szakértői rendszerek előnyei, hátrányai 


A szakértői rendszerek előnyei az emberi szakértőkhöz képest a következők: 


e Az emberi szakértők nem mindig elérhetőek, míg a szakértői rendszerek bármikor, 
bárhol rendelkezésre állnak, veszélyes helyeken is alkalmazhatók. 


e Az emberi szakértők nem mindig megbízhatóak, nem konzisztensek, míg a szakértői 
rendszerek következetesek, egyenletes teljesítményt nyújtanak. 


e Az emberi szakértő nem mindig tudja döntéseit megindokolni. 


e A szakértői rendszer költséghatékony, elérhető áron terjeszthető, fokozza a szakértő 
produktivitását és megőrzi a szakértelmet. 


A szakértői rendszerek hátrányai az alábbiak: 
e Ismereteik egy szűk problématerületet definiálnak, korlátaikat nem ismerik. 
e Tudásuk nem mindig naprakész, nem képesek tanulásra. 
e Javaslataikat, tanácsaikat elemezni kell. 
e Nincs hétköznapi józan eszük. 


e. Tudásbázisuk karbantartásához emberi szakértő, tudásménök szükséges. 
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8. fejezet 


Gépi tanulás 


8.1. Alapok 


A számítógépek megjelenése óta az egyik legérdekesebb kérdés, hogy vajon tudjuk-e a 
számítógépet valamilyen módon tanítani. Képesek vagyunk-e olyan rendszereket építeni 
vagy akár csak olyan tanuló algoritmusokat kifejleszteni, amelyek bizonyos tapasztalatok 
alapján automatikusan képesek működésük hatékonyságának a javítására. Mikor mondhatjuk 
azt, hogy egy algoritmus tanul? Egy algoritmus tanul ha egy feladat megoldása során olyan 
változások következnek be a működésben, hogy később ugyanazt a feladatot vagy ahhoz 
hasonló más feladatokat jobb eredménnyel, nagyobb hatékonysággal képes megoldani, mint 
korábban. 

A gépi tanulás a mesterséges intelligencia olyan részterületének tekinthető, amely a 
tapasztalatok feldolgozása alapján tanuló ágensek kifejlesztésével foglalkozik. 


8.2. Tanuló ágens 


A tanuló ágenseket napjainkban sok helyen használják a fejlesztők összetett alkalmazások 
fejlesztésénél, így például az adatbányászati vagy folyamatbányászati alkalmazásokban. 
Ezen alkalmazások célja, hogy nagyméretű adatbázisokból, illetve folyamatok eseményeit 
rögzítő napló fájlokból értékes, nem nyilvánvaló összefüggéseket tárjanak fel algoritmikus 
eszközökkel. 

A tanuló ágenseknek létezik egy általános modellje, amely kiindulásként szolgálhat 
minden tanulással felruházott ágens felépítéséhez. 

A tanuló ágens 4 fő részre bontható: 


1. Cselekvő alrendszer: Tartalmaz minden olyan ismeretet, amely a rendszer működte- 
téséhez szükséges. Rendelkezik egy tudásbázissal, amely felhasználható a megfelelő 
cselekvés kiválasztásához, amely az ágens környezetében végrehajtásra fog kerülni. 


2. Kritikus alrendszer: Feladata annak közlése a tanuló alrendszerrel, hogy az ágens 
működése mennyire sikeres. A kritikus rögzített standardot alkalmaz a teljesítmény 
minősítésére. Erre azért van szükség, mert az észlelések önmagukban nem adnak 
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8.1. ábra. A tanuló ágens felépítése 


információt az ágens sikerességéről, azaz maga az észlelés nem minősít. A minősítést 
egy ún. cselekvési norma alapján végzi el, amely alapvető elvárásokat tartalmaz a 
rendszer működésével, viselkedésével kapcsolatban. 


3. Tanuló alrendszer: A kritikustól érkező visszajelzések alapján módosító szabályokat 
javasol a cselekvő alrendszer számára, amelynek segítségével a rendszer minőségi 
feladat végrehajtásán lehet javítani. A javasolt új szabályok által bővül a rendszer 
tudásbázisa, így a megfelelő cselekvés kiválasztása egyre bővülő tapasztalat halmaz 
alapján történik meg. A tanuló alrendszer így a teljesítőképesség javításáért felel. 


4. Problémagenerátor alrendszer: Az ágens ezen részének az a fő feladata, hogy olyan 
cselekvést javasoljon végrehajtásra a cselekvő alrendszernek, amely új, informatív 
tapasztalatok megszerzéséhez vezet. Működésének a célja, hogy az ágens minőségi 
működését javítani lehessen. A cselekvő alrendszer ugyanis, ha azt teheti amit 
akar, akkor újra meg újra a jelenlegi tudása alapján fogja a végrehajtandó cselekvést 
kiválasztani. Ha azonban az ágens képes új területeket kutatni, akkor a hosszabb távú 
teljesítmény szempontjából sokkal jobb eljárás felfedezésére nyílhat lehetőség. (lásd 
8.1. ábra) 


Nézzünk a továbbiakban egy egyszerű példát a 4 fő egység működésére. Manapság már 
több kutató helyen próbálkoznak emberi beavatkozás nélkül működő járműveket fejleszteni. 
Ilyen járművek megmérettetésére az USA-ban versenyeket is szerveznek (lásd Grand Chal- 
lenge sivatagi robotverseny), amelyeknek a célja, hogy a járművek a kitűzött feladatokat 
minél pontosabban végre tudják hajtani. Egy ilyen jármű is tekinthető tanuló ágensnek, 
amelyben a 4 fő komponens megvalósításra kell, hogy kerüljön. A cselekvő alrendszer 
ebben az esetben mindazon tudásnak a gyűjteményéből épül fel, amelyek szükségesek a 
megfelelő jármű irányítási művelet kiválasztásáért (gyorsítás, fékezés, kanyarodás stb.). A 
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kritikus megfigyeli az autót körülvevő világot és információkat továbbít a tanuló alrendszer 
felé. Ha például olyan szituációba kerül a jármű, amelyben még eddig nem volt, akkor 
értékeli az arra való reakciókat. Alkalmilag a problémagenerátor is javasolhat olyan új 
megoldásokat, amelyek eredményes kipróbálása után a megvalósítás beépülhet a rendszer 
működésébe. Például egy már ismert út típuson próbáljon meg az autó megnövelt sebességgel 
haladni. A tanuló alrendszer a cselekvő komponens hatékonyságának javításáért is felelős, 
így ha egy ismeretlen úton kell haladnia a járműnek, azt feltérképezve, legközelebb már a 
feladatvégrehajtás gyorsabb lehet. 


(Megjegyzés: A tanuló ágens fogalmának megértéséhez futtassa az agens-auto.exe fájlt.) 


8.3. A gépi tanulás meghatározása 


Legyen egy tanulási példa egy (x, f(1)) adatpár, ahol z a bemenete, f(r) a kimenete az T-re 
alkalmazott leképezésnek. 

Az induktív következtetés feladata az f-re vonatkozó minták egy halmaza alapján, 
megadni egy olyan h leképezést, amelyik közelíti f-et. A h leképezést hipotézisnek nevezzük. 

Az igazi f függvényt nem ismerjük, így sokféle elképzelhető választás lehet h-ra. További 
tudás nélkül nem tudjuk, hogy melyiket részesítsük előnyben. Elfogultságnak nevezzük azt, 
ha a példáknak való megfelelésen túl előnyben részesítjük az egyik vagy másik hipotézist. 
Megjegyezzük, hogy az összes tanuló algoritmus mutat valamilyen elfogultságot. 

Gépi tanulás definíciója: Tekintsünk egy számítógépes programot, amely 7" osztályba 
eső feladatokat képes megoldani. A program működési hatékonyságának mérésére legyen 
P egy mérték, továbbá jelölje E azon tapasztalatokat, ismereteket, amelyekhez a program 
hozzáfér. Azt mondjuk, hogy a program a 7" feladatosztályon tanul, ha a P szerint mért 
hatékonysága javul az E ismeretek hatására. 

A tanulási feladat sok esetben informatikai szemszögből úgy jelentkezik, hogy a tanuló 
program példákat kap (25, y;) párok formájában. A programnak az a feladata, hogy olyan f 
függvényt keressen, amelyet használva minden adott pár esetén teljesül, hogy f(x) — Yv. 
A függvénytől elvárjuk, hogy alkalmazható legyen előre nem ismert x értékek esetén is az y 
érték meghatározására. Az ilyen típusú tanulást felügyelt tanulásnak nevezzük. 

Ha v;-nek két lehetséges értéke van, akkor a példákat pozitív és negatív példákra 
oszthatjuk. A tanulást ebben az esetben fogalmi tanulásnak nevezzük. 

Amennyiben a tanuló algoritmus számára csak az x; értékek állnak rendelkezésre, az v; 
értékekről nincsenek ismereteink, nem-felügyelt tanulásról beszélhetünk. Ilyen esetekben az 
algoritmus osztályozhatja a bemeneteket (osztályozási algoritmusok), vagy megpróbálhatunk 
bonyolultabb összefüggéseket feltárni az r; értékek között (ismeretfeltárási algoritmusok). 


8.4. Döntési fa 
A gépi tanulás során használható módszerek közül az egyik a döntési fa módszer, amely 
sikeresen alkalmazható számos feladat megoldása esetén. A döntési fa bemenete egy 


tulajdonsághalmaz segítségével leírt objektum vagy szituáció, kimenete pedig egy lehetséges 
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döntési javaslat. A fa mindegyik belső csomópontja megfelel valamelyik tulajdonság 
tesztjének, és mindegyik él a tesztben résztvevő attribútum lehetséges értékeivel címkézett. 
A fa mindegyik levélcsomópontja megadja azt a logikai értéket, amelyet akkor kell kiadni, 
ha ezt a levelet elértük. 

A döntési fát a szituációhoz tartozó példák felhasználásával hozhatjuk létre. A példát az 
attribútumok értékeivel és a célpredikátum értékeivel jellemezzük. A célpredikátum értékét 
a példa besorolásának nevezzük. 

A példákhoz tartozó döntési fa megtalálásához a következő ún. döntési fa tanuló 
algoritmust használhatjuk fel: 

Kezdetben a fa egy címkézetlen gyökér csúcsból áll, amelyhez hozzárendeljük az összes 
tanító példát (P) és attribútumot (A). Ha adott egy címkézetlen n csúcs, akkor a következő 
esetek fordulhatnak elő: 


1. Ha P — 0, akkor levélcsúcsot kaptunk, amelynek értékét a szülőcsúcs példáinak 
többségi szavazása alapján határozzuk meg. 


2. Ha P csak valamely kimenetnek megfelelő értéket tartalmaz, akkor egy a kimenetnek 
megfelelő levélcsúcshoz érkeztünk. 


3. Ha A — 0, akkor is levélcsúcsot kaptunk és a példák többségi besorolása alapján 
megkapjuk a levélcsúcs értékét. 


4. Egyébként a legnagyobb informativitási mérőszámmal rendelkező, még teszteletlen 
a E A attribútumot rendeljük az n csúcshoz, majd ezután generáljuk az összes 
címkézetlen utódját: 


e ezekhez az a lehetséges értékeivel címkézett élek vezetnek; 


e haaz a címkéjű n csúcsból az m csúcsba a v címkéjű él vezet, akkor az m csúcshoz 
rendelt 


— példák: P.-, — í(p c Plp.a— v) 
— attribútumok: A — A-fal 


e végül minden utódra ismételjük meg rekurzívan az 1-4 pontokat. 


A 8.2. ábra egy döntési fát mutat be. 

A továbbiakban nézzük meg, hogy hogyan lehet az informativitási mérőszámot megha- 
tározni, és ebből hogyan adható meg az informativitási nyereség. A generáló algoritmus 
az összes tulajdonság összes lehetséges szétosztásai közül azt választja ki, amelyiknek a 
legnagyobb az informativitási nyeresége. A b tulajdonság informativitásának ( /,) kiszámítása 
a következő: 

Legyen a csomóponthoz tartozó esetek halmaza C, a minősítő tulajdonság a, értékei 
du . . . an, És ezek előfordulási arányai a C halmazban wa . . . Wan (2 ,; Wai — 1). Ekkor a 
C halmaz minősítő tulajdonságának entrópiája így írható: Ec —-) "; wa:lognwai:. Legyenek 
a b tulajdonság értékei bi ...bn, ezek halmaza 6. Bontsuk fel D-t 87... 8m nem üres 
részhalmazokra! Ekkor [J, 8; — 8. Bontsuk fel C-t C! . . . Cm részhalmazokra úgy, hogy 
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1 5 3 4 


igen nem 


8.2. ábra. Egy döntési fa 





C; valamennyi elemének b tulajdonsága 65-be essen minden 7-re. Jelölje w; a C; súlyát C- 
ben Ő", wz: — 1). Ekkor I; — Ec-) ", wi.Ec,, így az informativitás a B7 . . . Bm felbontásból 
adódó entrópianyereség. A számítás tényleges kimenete az optimális felbontáshoz tartozó 
Ia. AZ ehhez tartozó informativitási nyereség: D, — wcl1,.../ Fc, ahol wc a C halmaz 
elemeinek száma. 

Az alábbi módszerrel lehetőségünk van a tanulási algoritmus teljesítnényét megbecsülni, 
ugyanis a tanulási algoritmus akkor megfelelő, ha jó hipotéziseket szolgáltat azokban az ese- 
tekben is, amelyeket nem látott előre. A vizsgálatot a példák egy teszthalmazán végezhetjük 
el, amelyhez a következő lépéseket kell végig követnünk. 


1. Gyűjtsük össze a példák egy nagy halmazát. 


2. A példahalmazt bontsuk szét két diszjunkt halmazra: egy tanítóhalmazra és egy 
teszthalmazra. 


3. A tanuló algoritmust a tanítóhalmaz példáira alkalmazva állítsuk elő a H hipotézist. 
4. Vizsgáljuk meg, hogy H a teszthalmaz példáinak hány százalékát sorolja be helyesen. 


5. Ismételjük meg az 1-4 lépéseket különböző tanítóhalmaz méretekre, és mindegyik 
mérethez különböző teszthalmazra. 


Ennek az algoritmusnak az eredményeként kapunk egy adathalmazt, amellyel az átlagos 
jóslási képesség a tanítóhalmaz méretének a függvényében vizsgálható. Egy ilyen jellegű 
vizsgálat kapcsán megfigyelhető, hogy a tanítóhalmaz méretének a növekedésével a jóslás 
minősége javulni fog. (Az érdeklődő olvasó további kiegészítő információkat olvashat [17]- 
ben.) 


8.5. Feladat és számítások 


Tegyük fel, hogy ingatlan eladással foglalkozó irodánk van. Szeretnénk az eddigi eladási 
tapasztalatok felhasználásával azt meghatározni, hogy melyek a jól eladható ingatlanok, 
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8.1. táblázat. Attribútumok és lehetséges értékeik 








alapterület . szobák kert fekvés kor 
szá- 
ma 
25-36 m? 1 igen belváros 0-2 között 
36-55 m" 2 nem kiemelt 2-10 között 
kertes 
városrész 
55-80 m? 3 kertes 10-25 
városrész között 
80-120 mf 4 25 felett 


120 m? felett 5 





milyen kritériumokkal rendelkeznek. Az attribútumok és lehetséges értékeik láthatók a 8.1. 
táblázatban. 

A fogalmi tanulást tekinthetjük egy keresési feladatnak, mivel az a cél, hogy a hipotézisek 
terében megkeressük azt a hipotézist, amelyik a legjobban illeszkedik a tanulási példákra. 
Mivel a hipotézis tér általában nagyméretű, ezért fontos, hogy hatékony keresési módszerrel 
tudjuk kiválasztani a legjobban illeszkedő hipotézist. A 8.2. táblázat a rendelkezésre álló 
példák halmazát ( P) írja le: 


A döntési fa felépítésének menete: 

1. lépésben kiszámoljuk az entrópia értékét a teljes példa halmazra vonatkozóan. 

E(PJ—-5 "log, 5-5"1og25— -0, 571488 -O 4285 EE. 
-04612-4-0,5238—0,985 


2. lépésként minden tulajdonság esetében meghatározzuk az informativitási nyereséget. 
C(P,alapterülety—0,985-5" E(25 — 36m?)-5"E(120m? felett)-3"E(55 — 80m?)- 

5" E(B0 — 120m?)-S"E(36 — 55m?)-0,985-0,2857-0,6993 

C(P szobák számaj—0,985-5"E(1)-5"E(5)-5"E(B)-5"E(4—0,6993 
C(P,kert——0,985-5"E(nem)-5"E(igenj—0, 5214 


C(P fekvésj—0,985-5"E(belváros)-5"E(kiemelt kertes városrész)- 
5"E(kertes városrészj—0,3056 


C(P,korj—0,985-5"E(25 felett))-3"E(2-10 között)-5"E(0-2 közötb)- 
5" E(10-25 közöttj—0,6993 
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8.2. táblázat. A döntési fa felépítéséhez használt példák halmaza 








Példa ! alapterület . szobák kert fekvés kor jól 
szá- eladható 
ma 

1. 25-36 m? 1 nem belváros 25 felett igen 

2. 120 m? felett 5 igen kiemelt  — 2-I0között igen 

kertes 
városrész 

3. 55-80 m? 3 nem kertes 0-2 között nem 

városrész 

4. 80-120 m? 4 igen kiemelt  — 2-I0Oközött igen 

kertes 
városrész 
120 m? felett 4 nem belváros 25 felett nem 
36-55 m" 3 nem belváros 10-25 nem 
között 

7. 80-120 m? 5 igen kertes 2-10 között . igen 

városrész 








3. Látható, hogy a kiszámolt értékek közül a legnagyobb érték az alapterület, a szobák 
száma és a kor attribútumokhoz tartozik, ezek közül válasszuk a szobák száma attribútumot 
a döntési fa gyökerébe. 


4. lépésként a gyökér csúcsból kiinduló éleket megcímkézzük a szobák száma attribútum 
lehetséges értékeivel, rendre 1, 5, 3 illetve 4 címkével. Az élekhez rendelt még címkézetlen 
csúcsokhoz hozzárendeljük azt a példahalmazt, amelybe azon példák fognak tartozni, ame- 
lyekben a szobák száma attribútum az 1, 5, 3 illetve 4 értékeket veszi fel. 

Így P1-be kerül az 1. tanulási példa, mivel ebben a szobák száma attribútum az 1 értéket 
veszi fel. 

A P2-be kerül a 2. és 7. tanulási példa, mivel a szobák száma attribútum ezekben az 5 
értéket veszi fel. 

A P3-ba kerül a 3. és 6. tanulási példa és végül a P4-be a 4. és 5. tanulási példa. 


5. lépésként megvizsgáljuk a Pl, P2, P3 és P4 halmazokba tartozó tanulási példák 
besorolását, azaz a jól eladható attribútum értékét. 

A P1l-ben a besorolás értéke igen, ezért levél csúcshoz érkeztünk és a levél csúcs értéke 
igen lesz. 

A P2-ben a besorolások értéke igen, ezért szintén levél csúcshoz érkeztünk és a levél 
csúcs értéke igen lesz. 

A P3-ban a besorolások értéke szem, ezért szintén levél csúcshoz érkeztünk és a levél 
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csúcs értéke nem lesz. 
A P4-ben a besorolások értéke igen és nem, ezért meg kell vizsgálni az attribútumokat, 
melyik a leginformatívabb, azaz melyik kerüljön a csúcsba. 


6. lépésként kiszámoljuk az entrópia értékét a P4 példa halmazra vonatkozóan. 


E(PAJ-—-5 "og; 2-3 t]oga - 


7. lépésként minden tulajdonság esetében meghatározzuk az informativitási nyereséget, 
kivéve a szobák száma attribútumot. 

C(P4 alapterület 1-5" E(120m? felett)-5"E(B0 — 120m9-I1 

C(P4 ker9)—1-5"E(nem)-5 "E(igenj—1 

C(P4 fekvésj—1 -2 tE(belváros)- 5) tE(kiemelt kertes városrészj—1 

C(P4 korj—1-5"EC25 felett)-5"EC2-10 között-—1 

Mivel az értékek azonosak lettek, válasszuk a csúcsba a kert attribútumot. 

Ezek után a döntési fa algoritmus lépéseit tovább követve folytathatjuk a döntési fa 


felépítését, amelynek lépéseit a dontesifa. avi fájl mutatja be (a fájl az AI Space Decision 
Trees http://www.aispace.org/dTree/ honlapon található segédprogrammal készült). 
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9. fejezet 


Neurális hálózatok 


9.1. Alapok 


A mesterséges neurális hálózat egy rendszer, melynek modellje az emberi agy. A területnek 
nagyon sok rokon értelmű elnevezése létezik, pl.: párhuzamosan elosztott feldolgozás, neuro- 
számítás, gépi tanulási algoritmus, természetes intelligens rendszerek és mesterséges neurális 
hálózatok. Tulajdonképpen a neurális hálózat egy kísérlet, amely speciális hardver elemek, 
és összetett szoftver segítségével szimulálni próbálja a neuronok több rétegű, de egyszerű 
működési elvét. Minden egyes neuron összeköttetésben áll bizonyos számú szomszédjával, 
ahol változó összeköttetési együtthatóval vesz részt a kapcsolatban, amely a kapcsolat erős- 
ségét reprezentálja. A tanulási folyamat úgy zajlik, hogy a kapcsolatok erősségét változtatjuk 
olyan irányba, ami a teljes rendszert a helyes eredmény elérésére sarkallja. A neurális 
hálózatok legalapvetőbb összetevőit az agy felépítése alapján modellezzük. Néhány neurális 
hálózati struktúra nem hozható közeli kapcsolatba az aggyal, ugyanakkor más felépítésű 
rendszereknek pedig a biológiai modellje nem létezik. Mégis általánosságban elmondható, 
hogy a neurális hálózatok erős hasonlóságot mutatnak az aggyal, ezért a terminológia nagy 
része az idegsebészetből lett átvéve. 









Soma (cell body) 


És 


Gy Nucleus 
mú jlss da za 69 


Axon 





Myelin sheath 


9.1. ábra. Egy neuronsejt 


A neurális hálózatok tervezési folyamatának lépései: 
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1. A neuronok rétegekbe szervezése. 


2. A neuronok kapcsolat típusának meghatározása mind a rétegen belül, mind az egyes 
rétegek között. 


3. Meg kell határozni azt a módszert, ahogy egy neuron fogadja az inputot, és kibocsátja 
az outputot. 


4. Meg kell határozni a kapcsolat erősségét a hálózaton belül úgy, hogy lehetővé tegyük 
a hálózat számára azt, hogy megtanulja a kapcsolatok megfelelő súlyozását egy ún. 
öntanuló adatbázist felhasználva. 


.y., 


juk a MATLAB$ [16] Neural Network Toolboxot (lásd 9.3. ábrát). 

Általánosságban elmondható, hogy minden neurális hálózatnak hasonló a topológiája. 
Némely neuronok kapcsolatban állnak a külvilággal, hogy fogadják a bejövő adatokat (input), 
mások a valóság felé kibocsájtják az eredményeket (output), míg az összes többi neuron rejtve 
marad a külvilág számára. A 9.2. ábra a neurális hálózat rétegeit szemlélteti. 


X x x 

v d ke 4 

e . is) e inputréteg 
SES rejtett réteg 


ke" output réteg 


Y1 Y2 Y m 


9.2. ábra. A neurális hálózat rétegei 


Az emberi agyban a neuronok (idegsejtek) számát mintegy 10""-re teszik. A neuro- 
nok dendritjeiken keresztül kapcsolódnak más neuronokhoz. A sejttest meghoszabbodott 
nyúlványa az axon, amely végződése közelében bokorszerűen szerteágazik. Az axon a 
szinapszisokon keresztül kapcsolódik más neuronok dendritjeihez vagy azok sejttestjéhez. A 
szinapszis küldő végén elhelyezkedő neuront preszinaptikusnak, a fogadó végén lévő neuront 
posztszinaptikusnak nevezik. Egy tipikus neuron axonja néhány ezer szinapszissal kapcsoló- 
dik más neuronokhoz. A neuronok az axonjaikon keresztül elektromos kisüléssorozatokkal 
kommunikálnak. A szinapszison keresztüli jelátvitel bonyolult kémiai folyamat. A folyamat 
során a küldő végről beérkező elektromos kisüléssorozat hatására ún. transzmitter anyagok 
szabadulnak fel, amelyek végső soron megnövelik, vagy éppen csökkentik a fogadó végén 
lévő sejttest elektromos potenciálját. Ha ez a potenciál elér egy küszöböt, a neuron egy ún. 
akciós potenciállal válaszol: egy rögzített hosszúságú elektromos kisüléssorozatot küld az 
axonján keresztül a vele összekötetésben álló neuronok felé. Ekkor mondjuk, hogy a sejt 
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9.3. ábra. Neurális hálózat létrehozása Matlab segítségével 


tüzelt. Tüzelés után a sejt egy meghatározott ideig, a refraktorikus időszakban nem tud újra 
tüzelni. 


(Megjegyzés: A neuronok információ átadó képességének bemutatásához futtassa a 
neuron-bio.exe fájlt.) 

Amikor a bemeneti réteg fogad egy inputot a neuronjai outputtá alakítják, ami a rendszer 
következő rétege(i) számára lesz bemeneti adat. A folyamat addig folytatódik, amíg meg 
nem felel egy meghatározott célnak, vagy amíg a kimeneti réteghez nem fordul a rendszer, 
ami végül kiadja az eredmény(e)t a külvilágnak. A neuronok utak hálózatán keresztül 
kapcsolódnak, továbbítva egy neuron kimeneti adatát a következő neuron számára bemeneti 
adatként. Ezek az utak általában egyirányúak, bár lehet kétirányú kommunikáció is a 
neuronok között, hiszen létezhet egy másik út is az ellenkező irányban. Egy neuron sok 
másiktól fogadhat inputot, de egy outputot produkál, amelyet továbbad a többi neuron felé. 
Egy neuron a rétegen belül kommunikálhat az összes többi neuronnal, de előfordulhat, hogy 
egyikkel sincs kapcsolatban. Egy réteg neuronjai azonban minden esetben összeköttetésben 
állnak minimum egy másik réteg neuronjaival. 

Különböző típusú kapcsolat lehet a rétegek között, ezeket hívjuk rétegek közti kapcso- 
latnak: 


e Teljesen összekapcsolt: Az első réteg összes neuronja összeköttetésben áll a következő 
réteg összes neuronjával. 
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Részlegesen összekapcsolt: Az első réteg egy neuronjának nem kell feltétlenül kapcso- 
lódnia a következő réteg összes neuronjához. 


Add tovább kapcsolat: Az első réteg neuronjai a kimenő adataikat továbbküldik a 
következő réteg számára, de semmiféle visszacsatolást a második rétegtől nem kapnak. 


Kétirányú kapcsolat: Ebben az esetben a második réteg visszacsatol az első réteg felé. 
Az Add tovább és a Kétirányú kapcsolat lehet teljesen összekapcsolt és részlegesen 
összekapcsolt. 


Hierarchikus kapcsolat: Ha egy neurális hálózat hierarchikus szerkezetű, az alsóbb 
réteg neuronjai csak egy következő (mélyebb) réteg neuronjaival kommunikálhatnak. 


Ismétlődő kapcsolat: A rétegek kétirányú kapcsolattal rendelkeznek, és egy meghatá- 
rozott ideig folyamatosan küldhetik üzeneteiket a kapcsolatokon keresztül mindaddig, 
amíg egy meghatározott célt el nem ér a rendszer. 


Rétegen belüli kommunikáció: Összetettebb struktúrák esetén a neuronok kommuni- 
kálnak egymással a rétegen belül, ezt nevezzük rétegen belüli kommunikációnak. Kétféle 
rétegen belüli kommunikációt említenénk meg: 


e Visszatérő, ismétlődő kapcsolat: A réteg neuronjai teljesen, vagy részlegesen össze- 
kapcsoltak. Miután ezek a neuronok fogadták egy másik réteg adatait (input), a 
saját kimenő adataikat (output) többször , megbeszélik" egymással, mielőtt azt tovább 
küldhetnék egy következő réteg számára. Általában egy bizonyos követelményt a 
neuronoknak a rétegen belüli kommunikáció során teljesítenie kell, mielőtt tovább 
küldhetnék eredményeiket a következő rétegnek. 


e Központi/környezetet kizáró kapcsolat: A rétegben lévő neuron ösztönző (támogató) 
kapcsolatban áll önmagával és közvetlen szomszédjaival, és gátló kapcsolatban van az 
összes többi neuronnal. El lehet képzelni ezt a fajta kapcsolatot úgy, mint neuronok 
egymással versenyző csoportjait. Minden egyes csoport ösztönzi önmagát és a csoport 
tagjait, és gátolja a többi csoportot, azok tagjait. Néhány ciklus adatcsere után az 
aktív outputtal rendelkező neuronok , győznek", és a döntési súlyuk (és csoportjuké) a 
hálón belül növekszik. Kétféle kapcsolat létezik a neuronok között: támogató, és gátló. 
Támogató kapcsolat esetén egy neuron kimenete a vele kapcsolatban álló másik neuron 
döntési potenciálját (súlyát) növeli. Gátló kapcsolat létrejöttekor a kimenetet küldő 
neuron a befogadó neuron döntési (cselekvési) potenciálját csökkenti. Az első típus a 
vevő neuron összegző mechanizmusát hozzáadásra készteti, míg a második kivonásra, 
azaz az első erősít, míg a második gyengít. 


Leegyszerűsítve a dolgot, a neurális hálózat felfogható egy olyan modellnek, amelyben 
minden neuron bekapcsolt, illetve kikapcsolt állapotban lehet, és amelyben az átkapcsolás be 
állapotba akkor kerül, amikor a neuront kellő számú szomszédos neuron stimulálja. 

A neurális hálózatok jellemzőt: 
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Taníthatók: létezik olyan eljárás, amellyel a hálózat bemenetére adott mintákhoz tarto- 
zó kimeneti minták többszöri megadása után a hálózat valamennyi betanult mintához 
a kívánt legjobb kimenetet szolgáltatja. 


Általánosító képességgel rendelkezik: a be nem tanított esetekre is közelítően jó 
megoldást adnak. 


Hibatűrők: az előző tulajdonságokból adódóan a bemeneti hibákra kevésbé érzéke- 
nyek. 


Gyors a válaszidejük. 

Főbb alkalmazási területek: 

e mintafelismerés (hang- és képfeldolgozás, alakfelismerés, jelfeldolgozás), 
e nem lineáris rendszerek szimulációja (előrebecslés, tanácsadás), 

. adattömörítés (képtovábbítás), 


e szabályozás. 


9.2. Neurális hálók tanulása 


Az agy általában a tapasztalatokból tanul. A neurális hálózatokat időnként gépi tanulási 
algoritmusnak is nevezik, mert a kapcsolat súlyának (tanulás) megváltoztatásával tanulja 
meg a rendszer egy probléma megoldását. A kapcsolat erősségét a neuronok között egy 
súly értékként tároljuk. A rendszer úgy tanulja meg az új ismereteket, hogy ezeken a súly 
értékeken változtat. Ami azt jelenti, hogy a háló súlyait , tanítjuk", ami egy iteratív eljárás, 
melynek során a háló által megvalósított leképezést egy kívánt leképezéshez közelítjük. A 
kívánt leképezés a neuronháló tanításánál összetartozó be- és kimeneti mintapontok (25, vb 
i — 1,2,...,p alapján történik. A tanító pontokban meghatározva a háló kimenetét és 
összehasonlítva a kívánt kimenettel hiba képezhető, mely hibaértékek minimalizálása a cél. 

Általános esetben egy hibafüggvény definiálható és a tanítás során a szabad paraméterek 
olyan beállítása a cél, mely a kritérium függvény minimumát biztosítja. Egy neurális hálózat 
tanulási képességét a felépítése és a tanulási algoritmusa határozza meg. 

A tanulási módszer lehet: 


e Nem felügyelt tanulás: A rejtett neuronoknak meg kell találniuk a módot az önszerve- 
zésre külső segítség nélkül. Ennél a megközelítésnél nincsenek , minta eredmények" a 
rendszer számára, amely segítségével megjósolhatná a teljesítményét a kapott értékek 
(inputok) függvényében. Itt a rendszer a folyamat végrehajtása során tanul. 


e Megerősítéses tanulás: A módszer a külső megerősítésen alapul. A kiinduló kapcsolat 
a rejtett réteg neuronjai között véletlen szervezésű, amit újraszerveznek, amint a 
rendszernek , megmondják" milyen közel áll a probléma megoldásához. 
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A tanulási módszereket egy másik csoportosítás szerint is kategorizálhatjuk. Ha a rendszer 
arra használja a bejövő adatokat, hogy súlyarányait megváltoztassa a tudás elsajátítása 
érdekében, akkor a rendszer betanuló üzemmódban működik. 


Tanulási szabályok 

Nagyon sokféle szabály van használatban. Ezek matematikai algoritmusok, melyeket a 
kapcsolatok súlyának frissítésére használnak. A tanulási folyamat annál sokkal összetettebb, 
mint a ma ismert szabályok által nyújtott egyszerűsített ábrázolás. A kutatás az újabb és újabb 
tanulási szabályok megismerésére tovább folytatódik, új ötletek nap mint nap bukkannak fel 
a publikációkban. A következő szabályokat példaként mutatjuk be: 


e Hebb szabály: Az első és legismertebb tanulási szabály D. Hebb nevéhez kapcsolódik. 
Alapelve: Ha egy neuron fogad egy adatot (input) egy másik neurontól, és ha mindkettő 
nagyon aktív (matematikailag ugyanazt az értéket tartalmazza), akkor a neuronok 
súlyát erősíteni kell. Ez azt jelenti, hogy az z-edik és a j-edik neuron közötti kapcsolat 
súlya egy t időpontban w;(t). Az i-edik neuron aktivációs állapota A; a j-edik neuron 
aktivációs állapota A; és legyenek ezek Boole-értékek (pl. 0 és 1). A Hebb szabály at 
és a (tót) között érkező hatás esetén azt eredményezi, hogy w;j(t--ót) — w:j--LA;A;j, 
u 5 0 tényező a tanulás erőssége. 


e Hopfield szabály: A szabály hasonló Hebb szabályához azzal a különbséggel, hogy 
meghatározza az erősítés vagy gyengítés nagyságát. Azt állítja, hogy: ,,...ha a tervezett 
output és input egyszerre aktív vagy inaktív, akkor növelje a kapcsolat súlyát a tanulás 
arányával, egyébként csökkentse a kapcsolat súlyát a tanulás arányával." (A legtöbb 
esetben a tanulás aránya, a tanulási állandó egy pozitív, nulla és egy közé eső érték.) 


e Delta szabály: A Delta szabály is Hebb szabályára épül, és ez az egyik legelterjedtebb a 
szabályok közül. A szabály a bemeneti kapcsolatok súlyának folyamatos változtatására 
épül, hogy csökkentse a különbséget (delta) a neuron tervezett és valós kimeneti értéke 
között. A szabály úgy változtatja a súlyt, hogy minimalizálja a rendszerhiba négyzetes 
középértékét. A hibát visszatovábbítják az eggyel előző rétegbe. A rendszerhibák 
visszacsatolása mindaddig folytatódik, míg el nem érik a legfelső réteget. 


e Kohonen tanulási szabálya: Ezt az eljárást T. Kohonen fejlesztette ki. Itt a neuronok 
, versenyeznek" a tanulás lehetőségéért a súlyuk növelése érdekében. A legnagyobb 
outputtal rendelkező neuront tekintik , győztesnek" és annak van meg az a képessége, 
hogy gátolja versenytársait, vagy erősítse szomszédjait. Csak a győztes bocsáthat ki 
outputot, és csak a győztes és szomszédai növelhetik kapcsolati súlyukat. 


Azt gondolhatnánk, hogy minél több neuronunk van, annál jobban tanul a háló, de ez 
nem így van. A hálózat érzékennyé válhat a konkrét adatokra. Függvényközelítésben ez 
úgy látszik, hogy a függvénygörbe nagyon jól illeszkedik az alappontokban, de közöttük 
feleslegesen hullámzik. Ekkor a hálózatot túlillesztettnek (túltanítottnak) nevezzük. Ezért 
meg kell találnunk a neuronok számának és a tanítóhalmaznak az optimális nagyságát. 
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9.3. A McCulloch-Pitts neuron modell 


Legyenek a bemeneti adatok x(n) — [x1(n), . . . , rm(n)]" m dimenziós vektorok, ahol n — 
1, 2, . . . az időpillanatokat jelenti. Az ismeretlen rendszer minden r(n)-hez megad egy d(n) 
kimeneti értéket. 

A célunk az, hogy ezt az ismeretlen rendszert helyettesítsük egy olyan egységgel, amely 
adott input esetén , hasonló" outputot ad, mint az eredeti. 


A McCulloch-Pitts neuron sematikus modellje: A neuron tüzel, ha inputjainak súlyozott 


összege ) ; wjrj meghaladja a 9 küszöböt. 
j—I 


(Megjegyzés: A neuron működésének bemutatásához futtassa a neuron-mat.exe fájlt.) 

A McCulloch-Pitts modellben egy modellneuron működését az 

y(t 4-1) — AA; wjrj(t) — 9) 

JE 

egyenlettel írhatjuk le, ahol sgnT az egységugrás függvény: sgnt(h) — I,hah 5 0 
és sgnt(h) — 0 minden más esetben. xj(t) ec (0,1) pontosan akkor 1, ha a j-edik 
preszinaptikus neuron a t. időpillanatban tüzel és y(t -- 1) e (0, 1) akkor 1, ha a modellezett 
neuronunk tüzelni fog a t-- 1-edik időpillanatban. A w; súlyok modellezik a 7-edik szinapszis 
átvivő képességét. Ha wj 5 0, akkor a szinapszis gerjesztő, ha w; — 0, akkor a szinapszis 
nem ereszt át jelet, ha w; Ca 0, akkor a szinapszis gátló. A 9 paraméter a neuron tüzelési 
küszöbét jelzi: ha az inputok súlyozott összege meghaladja a 0 értéket, a neuron a t -- 1- 
edik pillanatban tüzelni fog, egyébként pedig nem tüzel. A neuron tanulását az w; súlyok 
(j — 1,..., m) változtatásával valósíthatjuk meg. 

A 9.4. ábrán egy neuron sematikus ábráját láthatjuk. 


x1(t) 
ag 
Nwl 


KZYDN tú 
——— 


xn(t/ Í 


9.4. ábra. Az általános neuron modell 


9.4. Hopfield típusú hálózatok 


A neuronhálózatok McCulloch-Pitts modelljei neuronok sokaságából felépülő rendszerek. 
A neuronhálózatok váza egy súlyozott irányított gráf: a gráf csúcspontjaiban vannak a 
neuronok, a neuronok összeköttetéseit pedig a gráf éleihez rendelt súlyok határozzák meg. 
Ha az i csúcsból van él a j csúcsba, akkor a j csúcshoz tartozó neuron bemenetet kap az i 
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neurontól, és az 1. neuron outputja a j. neuron számára az (ij) élhez tartozó valós számmal 
súlyozottan jelenik meg. 

A Hopfield hálózatok eredetileg az asszociatív memória modellezésének céljára szol- 
gáltak, később azonban kombinatorikai feladatok megoldására és a kiszámíthatóság model- 
lezésére is felhasználták őket. Ha például az asszociatív memóriaegységünkben képeket 
tárolunk, akkor a memóriaegység már a kép egy része alapján is képes kell legyen a kép 
hiányzó részének kiegészítésére. A Hopfield hálózatokban a memórianyomokat, mint az 
X — (—1,1)" tér elemeit reprezentáljuk. A hálózat N db McCulloch-Pitts-féle neuronból 
áll, mindegyik neuron mindegyik másik neuronnal össze van kötve. 


Az egyrétegű visszacsatolt háló szerkezete: 

Az alapmodell esetén a háló bemenetei binárisak. Az egyrétegű modellben a neuronok 
kimenetei minden neuron bemenetére súlyozott összeköttetéseken keresztül vannak vissza- 
csatolva. A megfelelően beállított súlyokkal rendelkező hálózattól azt várjuk, hogy az adott 
kezdeti konfigurációból kiindulva az ehhez legközelebbi stabil állapothoz tartozó pontban 
stabilizálódik. 

Célja egy nyugalmi helyzet előállítása: 

e Minden neuron kezdő állapota egy-egy bemeneti érték. 


e Egy neuron mindaddig újra számolja a többi neuron kimeneti értéke alapján a belső 
állapotát, ameddig az eltér a korábbi állapotától. 


e A stabil helyzetben kialakult állapotok lesznek a kimeneti értékek. 


A modell működése: 
Az 1-edik neuron az 


x(t4 1) — sgn( 3 wijrj(t) — 9;) 


képlet alapján számolja ki a következő időpillanatbeli aktivitását, ahol sgn(h) — —1, ha 
h a 0, egyébként sgn(h) — 1. Itt w;j az i-edik neuront a j-edikkel összekötő kapcsolat 
erőssége, és 0; az i-edik neuronhoz tartozó küszöbérték. Minden időpillanatban egy és csak 
egy neuron számolja újra az aktivitását. 

A hálózat outputja az egyensúlyi helyzet beálltakor kialakult mintázat. Ennek előállítása a 
súly értékek megfelelő változtatásával lehetséges pl. a Hebb szabály alkalmázásán keresztül. 
Az egyensúlyi helyzet akkor áll be, amikor már minden neuron újraszámolta az aktivitációs 
értékét. Az ilyen hálózatokat használják, pl. karaktersorozatok felismerésére és mintázatok 
generálására. 

A neuronhálózatok további családjai (ezekkel nem foglalkozunk ezen keretek között 
részletesebben, az érdeklődő olvasónak a [4]-t ajánljuk további tanulmányozásra): 


e versengő neuronok, 


e előrecsatolt neuronhálózatok stb. 


(Megjegyzés: A neuronháló működésének bemutatásához futtassa az idojaras.exe fájlt. 
A fejezethez tartozó feladatok az NHMatlab1 .pdf fájlban található.) 
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10. fejezet 


Evolúciós stratégiák, genetikus 
algoritmusok 


10.1. Alapok 


Ebben a fejezetben az evolúciós stratégiák/módszerek közül csak a leggyakoribb, a biológiai 
evolúció által ösztönzött változatokról szólunk és azok közül is kiemelten a genetikus 
algoritmusokról. 

Az algoritmus mechanizmusa és fogalom rendszere a darwini evolúciós elméletre és a 
genetika alapjaira épít. Azt mondhatjuk, a módszer mindenhol alkalmazható, ahol a feladat 
sok lehetséges megoldás közül a legjobbat megkeresni, ahol az értéket egy rátermettségi 
tartja fenn, azaz egyszerre több megoldással (egyeddel) dolgozik. Az aktuális populációból 
minden lépésben egy új populációt állít elő úgy, hogy a szelekciós operátor által kiválasztott 
legrátermettebb elemeken alkalmazza a rekombinációs és mutációs operátorokat. 

Az alapgondolat az, hogy mivel általában minden populáció az előzőnél rátermettebb 
elemeket tartalmaz, a keresés folyamán egyre jobb megoldások állnak rendelkezésre. 


(Megjegyzés: A genetikus algoritmus működési alapelvének bemutatásához futtassa a 
genetikus.exe fájlt.) 

A 60-as években merült fel először az a gondolat, hogy az evolúcióban megfigyelhető 
szelekciós folyamatok mintájára olyan számítógépes modelleket lehetne létrehozni, amelyek 
képesek mérnöki — elsősorban optimalizálási — feladatok megoldására. A több mint 50 év 
alatt mind a szűkebb értelemben vett genetikus algoritmusok, mind a tágabban értelmezett 
evolúciós módszerek komoly fejlődésen mentek keresztül, többféle változatuk jött létre és 
egyre teljesebbé vált a matematikai megalapozásuk. 4 fő kutatási terület alakult ki: 


1. 1966 Fogel, Owens, Walsh: evolúciós programozás, 
2. 1973 Rechenberg: evolúciós stratégiák, 
3. 1975 Holland: genetikus algoritmusok, 


4. 1992 Koza: genetikus programozás. 
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Mi ezek közül elsősorban a genetikus algoritmusokkal foglalkozunk a továbbiakban, 
mivel a legtöbb alkalmazás ezen területhez kapcsolódik. (A többi területről bővebben [5]- 
ben és [2]-ben olvashat a kedves olvasó.) 

Az életnek nagyon sok olyan területe van, ahol találkozhatunk optimalizálási feladatok- 
kal, így például: 


e a napi beosztásunk elkészítése, 
e két város között az optimális út megtervezése, 
. egy kórházban a betegek számára a napi menü összeállítása stb. 


Amennyiben létezik alkalmazható módszer az adott problémára, akkor az jobban visel- 
kedik a genetikus algoritmusoknál, vagyis gyorsabban és az optimumot jobban megközelítve 
ad eredményt. Vannak viszont problémák (lásd előbb említett feladatok), amikor a klasszikus 
módszerek nem alkalmazhatók, ilyenkor lehet segítségünkre a genetikus algoritmus. A 
genetikus algoritmusok fő jellemzőt: 


e többpontos keresést valósítanak meg, 
e flexibilisek, 


e robosztusak: ha egy keresési út zsákutcának bizonyul, az még nem jelenti az egész 
algoritmus kudarcát, 


e biztosítják, hogy elfogadhatóan gyorsan, elfogadhatóan jó megoldást találjunk, 


e a problémának nem egy, hanem több különböző közel optimális megoldása lehet, 
amelyből a felhasználó ki tudja választani a neki legmegfelelőbbet. 


10.2. Az algoritmus általános felépítése 
Az alap algoritmus lépései: 

1. Hozzuk létre a Po kezdeti populációt 

2. t:0 

3. while not Kilépés( P.) 

4. — P/ — UjElemek(P)) 

5. B. — UjPopuláció(P!,P) 

6. t:—ti41 


7. end of while 
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A kezdő populáció feltöltése leggyakrabban véletlen elemekkel történik. A populációk 
elemszáma a futás során változatlan, az 50-100 körüli értékek a tipikusak. A Kilépés( PF.) 
függvény sokszor nem is függ a populációtól, mint ahogy a jelölés sejtetné, a tipikus módszer 
a már kiértékelt megoldások számának a vizsgálata. Az algoritmus futása ebben az esetben 
akkor áll le, ha egy előre adott mennyiségű különböző lehetséges megoldás rátermettségét 
kiszámoltuk. A megengedett kiértékelések konkrét száma függ a problémától, leggyakrabban 
1000 és 500000 között van. Az UjElemek( P.) függvény feltölti a P/ populációt új elemekkel. 
Egy új megoldás előállítása legtöbbször úgy történik, hogy a szelekció segítségével szülőket 
választunk. A kiválasztás alapja az egyes egyedek fitneszértéke (rátermettsége), majd a 
rekombináció ezekből egy utódot hoz létre. Erre azután alkalmazható a mutáció, majd az 
új elem rátermettségének a meghatározása következik. A P/ populáció elemszáma nem 
feltétlenül azonos P, elemszámával. Ha mégis azonos, az UjPopuláció( P;,P.) függvény 
egyszerűen a P/ populációt adja. Ekkor a genetikus algoritmus generációs. Ha azonban P/ 
elemszáma kisebb, a megfelelő mennyiségű elemet törli a régi populációból, és a helyükre 
P; elemei kerülnek. A genetikus algoritmus egymást követő lépéseit a 10.1. ábra mutatja be. 


10.3. A gráfszínezési probléma 


A probléma: Egy adott irányítatlan gráfhoz találnunk kell egy jó k-színezést, ami azt jelenti, 
hogy minden csúcshoz az előre adott k különböző szín valamelyikét kell rendelni úgy, hogy 
minden él két különböző színű pontot kössön össze. 

A genetikus algoritmus populációk sorozatát állítja elő, a populációk megoldásokat 
tartalmaznak. Itt egy megoldás a gráf egy színezése. 

A megoldásokat kódolni kell, hogy újabb megoldásokat lehessen szerkeszteni. Minden 
megoldáshoz így hozzárendelünk egy szintaktikailag jól manipulálható betűsorozatot egy 
kódoló függvény segítségével. Kétféle kódolást is megemlítünk ezen feladathoz: 


e Direkt kódolás: A gráf pontjaihoz rendelt színeket (a színekhez rendelt sorszámokat) 
egyszerűen felsoroljuk, ez a számsorozat lesz a kód. 


e. Sorrendi kódolás: Sorra vesszük a pontokat és minden pontot kiszínezünk arra a 
minimális sorszámú színre, amelynek használata az adott helyzetben lehetséges. Ha 
egyetlen szín sem megfelelő, színezetlenül hagyjuk a pontot. Ha létezik jó színezés, 
akkor minden pontnak lesz színe, egyébként maradnak színezetlen pontok. 


A rátermettségi függvényt például úgy definálhatjuk, hogy a rosszul színezett (azaz 
azonos színű pontokat összekötő) élek számának a függvénye legyen. Minél kevesebb a 
rossz él, annál nagyobb kell, hogy legyen a rátermettsége a kérdéses megoldásnak. Egy 
színezés rátermettsége így lehet például a rossz élek számának a minusz egyszerese, így 
minden jó színezés maximális rátermettségű lesz. f(e) — —k, ahol a gráf éleinek a száma 
— e; a csúcsok száma — n; megegyező színű pontokat összekötő élek száma — k; minden jó 
színezésnél f(e) — 0. (A 10.2. és a 10.3. ábrán ugyan azon gráf kétféle színezését láthatjuk.) 

A kódolás és az operátorok akkor megfelelőek, ha rátermett megoldásokból kiindulva a 
leszármazott megoldások is hasonlóan jó tulajdonságokkal rendelkeznek. Feltéve, hogy a 


www.tankonyvtar. hu 0 Piglerné Lakner Rozália, Starkné Werner Ágnes, PE 


10.3. A GRÁFSZÍNEZÉSI PROBLÉMA 79 















Probléma felépítés 










Lényeges 
tulajdonságok, kódolás 


meghatározása 
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végrehajtási műveletek meghatározása 
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rekombináció, mutáció 
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Rátermettségi függvény 
meghatározása 


Kilépési feltétel 
meghatározása 
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Jósági mérték 
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rátermettségi függvény 
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reprodukció 












Jósági mérték 
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rátermettségi függvény 
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feltétel vizsgálata 













Eredmény kiválasztása 
és dekódolása 





10.1. ábra. A genetikus algoritmus lépései 


kódolás jó, nem mindegy, hogy az operátorainkat mely megoldásokra alkalmazzuk amikor 
a soron következő populációt szeretnénk előállítani. Ezeknek a szülőknek a kiválasztása 
a szelekciós operátor feladata. Többféle szelekciós algoritmust ismerünk, mint például 
rátermettség-arányos szelekció, párverseny szelekció, rulettkerék szelekció, rangsorolás stb. 
Nézzük ezek közül az első kettő működését: 


e Rátermettség-arányos szelekció: A módszer valószínűségi mintavételt használ. Egy 
megoldás kiválasztásának a valószínűsége annál nagyobb, minél nagyobb a rátermett- 
sége a populáció rátermettségi átlagához képest. A populáció minden e elemére a 
kiválasztódás valószínűségét a következő módon adhatjuk meg: 


P(e) — mzftécpj, ahol f(e) a rátermettség értéke, n a populáció elemszáma és f(Pop) 


a populáció tagjainak átlagos rátermettsége. 


e Párverseny szelekció: Válasszunk ki a populációból két megoldást teljesen véletlensze- 
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10.2. ábra. Egy gráf 3-színezése, nem megfelelő megoldás, vannak azonos színű csomópon- 
tokat összekötő élek 


10.3. ábra. Egy gráf 3-színezése, jó megoldás 


rűen és a szelekció által kiválasztott elem legyen a kettő közül a rátermettebb. Ugyanez 
a technika általánosítható úgy, hogy nem kettő, hanem több elem győztesét választjuk 
ki. 


A kódokon alkalmazott operátorokat szokás két csoportba sorolni. Az elsőbe tartoznak 
azok, amelyek több kiindulási megoldásból (szülőből) állítanak elő újabb megoldást vagy 
megoldásokat a szülők kódjainak kombinációja segítségével. Ezt az operátort rekom- 
binációnak nevezzük. Ilyen művelet például az egypontos keresztezés, amely esetében 
véletlenszerűen választunk az egyedben egy keresztezési pontot, és a keletkezett fél kódokból 
új megoldást rakunk össze. 

A másik csoportba tartoznak azok, amelyek egy megoldásból állítanak elő egy újabbat, az 
ilyen operátort mutációnak nevezzük. Ilyen művelet például, ha véletlenszerűen választunk ki 
pozíciókat és változtatunk meg. Az alábbi 10.4. ábrán egy gráfszínezési probléma kiindulási 
gráfját és a 10.5. ábrán pedig a genetikus algoritmus végrehajtása utáni eredményt láthatjuk. 


(Megjegyzés: A genetikus algoritmus működésének bemutatásához futtassa a hou- 
se.exe fájlt. A fejezethez tartozó feladatok a GAFuggveny.pdf, GAGrafszinezes.pdf, GAL- 
rendszerek.pdf, GAMatlab1 .pdf, GAMatlab2.pdf, GATrans-GA.pdf fájlokban találhatók.) 
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Kundulás 


MI - genetikus algoritmus 


Csúcsok száma: (7 51 Színek száma: [4-1 





Egypontos keresztezés 





1111111 R:-9 


10.4. ábra. A gráf, melynek csomópontjait megfelelő színnel kell ellátni 


Eredmény 


MI - genetikus algoritmus 


Csúcsok száma: [71 színek száma: [4771] " Generálás 





Operátor: [egypontos keresztezés 7] Lépésszám: [100071] / Frissítési 
Egypontos keresztezés 





1111111 R:-9 


Megoldások (5 db) 


2311144 527.lépés -S,524 1251144 715.lépés -S5,161 1421244 874.lépés -4,938 1431144 919.lépés -4,877 4211344 925.lépés -4,868 





10.5. ábra. A genetikus algoritmus futásának eredménye 
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11. fejezet 


Robotika 


11.1. Alapok 


Már az ókorban felmerült az igény, hogy az ember munkáját valamilyen géppel segítsük, 
bizonyos fázisokban az embert helyettesítsük. Ez azt is jelenti, hogy természeti környe- 
zetünkben kellene helytállnia egy gépnek, illetve a programjának. A környezetben nem 
adhatunk meg mindent pontosan az utolsó milliméterig, grammig, így a programot nem 
csupán bizonyos állapotokra, hanem igen gazdag lehetőségekre kell felkészíteni. Elvégre 
nem állhat meg egy teljes gyár, ha az egyik szerelőszalag fél centivel odébb állította meg 
a munkadarabot. A mesterséges intelligencia alkalmazásának az egyik legfontosabb és 
leglátványosabb területe a robotika. 

Néhány szó a robotika szó eredetéről: Maga a robot szó 1921-ben Carel Capek Rossum 
Univerzális Robotjai című színdarabjában fordul elő elsőként. A robota szó csehül munkát 
jelent. Capek robotja önálló, döntésre képes eszköz, amely felülkerekedik alkotóján, és 
rabszolgasorba süllyeszti az embert. 

Roboton általában olyan eszközt, berendezést értünk, amely az ember fizikai és/vagy 
szellemi munkájához hasonló tevékenységet végez. Ehhez rendelkezniük kell számos, sok 
esetben az intelligencia elemei közé tartozó tulajdonsággal: 


e tudás, 

e emlékezet, 

e tanulási képesség 

e döntéseken alapuló közlési-cselekvési képesség stb. 

A robotok egyik legfontosabb tulajdonsága a helyváltoztatási képesség, illetve esetlege- 
sen annak hiánya. Ez alapján megkülönböztethetünk mobil és statikus robotokat. Előbbiek 
közé tartoznak az androidok, az animatok, az ember nélküli járművek, szórakoztató robotok 
és az általános autonóm robotok. A háztartási és ipari robotok — elsősorban a robotkarok 


— általában statikusak, de ez nem követelmény. Speciális robotok a nanorobotok, melyek a 
fizikai és kémiai területek határmezsgyéjén találhatók. 
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11.2. Egy kis történelem 


Néhány érdekes korábbi automatizálási példától eltekintve, az első valódi robotszabadalmat 
C. W. Kennward angol feltaláló nyújtotta be 1954-ben. A mai ipari robotok története mégis 
inkább J. Engelberger (11.1. ábra) és G. C. Devol amerikai irányítástechnikai és elektronikai 
szakértők nevéhez fűződik, akik először éreztek rá a robotokban rejlő üzleti lehetőségekre. 
Engelbergernek a Consolidated Controls néven megalakuló, majd később Unimation néven 
működő cége 1960-ban gyártotta le az első ipari robotot Unimate (11.2. ábra) néven. A gépet 
a Ford Motor Co. már 1961-ben megvásárolta (fröccsöntő gép kiszolgálására használta fel, 
egészen az 1980-as évekig). Ugyanebben az évben jelent meg Devol robotszabadalma. Az 
Amerikai Egyesült Államokban 1962-ben, másodikként az American Machine and Foundry 
cég is megjelent egy gyártmánnyal (Versatran), s tíz év múlva, 1972-ben már 12 vállalat 
gyártott ipari robotot az USA-ban. Az ipari robotok fejlődésében tehát az első jellegzetes 
fázis az 1960-as évekre tehető. Míg a finomabb szabályozású robotok ekkor hidraulikus 
szervoirányítással rendelkeztek, velük párhuzamosan terjedtek a , pick and place" manipulá- 
torok, amelyek az emberi munkaerőt monoton és fárasztó munkákban helyettesítették a nagy 
tömegben ismétlődő anyag- és munkadarab-mozgatási feladatok ellátásával. 





11.1. ábra. J. Engelberger, a robotok egyik atyja 


Az első technológiai robotalkalmazás viszonylag korán, 1966-ban jelent meg a Trallfa 
norvég mezőgazdasági üzem fejlesztésének köszönhetően, egy humanoid karszerkezetű 
festőrobot használatával. Még az 1960-as évtized végén kiterjedt a technológiai alkalmazások 
köre az ívhegesztésre is. 

A második jelentős fejlődési fázis az 1970-es évekre tehető japán licencvásárlásokkal és 
európai cégek megjelenésével, újabb műszaki megoldásokkal, s a robotalkalmazás körének 
jelentős bővülésével jellemezhető. 

Mérföldkövek: 
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11.2. ábra. A robotok egyik első megvalósított darabja: Unimate 


Kawasaki 1972-es licenc-vásárlása, és a gyártósor felszerelése a Nissan Motors-nál; 


a svéd ASEA IRB-6 (1973) és IRB-60 (1974) villamos meghajtású robotjainak megje- 
lenése és elterjedése az ívhegesztéses alkalmazásokban; 


az amerikai Cincinnati Milactron NC-gyártó vállalat megjelenése az első teljesen 
számítógép-irányítású CGA vagy T3 robottal, elsősorban fúrási, marási, illesztési 
műveletek végzésére; 


az irányítási rendszer korszerűsödése az ASEFA-nál lehetővé tette köszörülési, sorjázási, 
polírozási feladatok robotizálását; 


e az ún. playback technika kifejlesztése a Trallfa cégnél jelentősen javította a robotok 
festésre való felhasználhatóságát; 


e az európai autógyárak saját robotfejlesztéseinek kezdete (Volkswagen, Renault, Fiat); 


új típusok kifejlesztése és gyártása belföldi piacra Japánban (Hitachi, Kawasaki, 
Yasakawa, Oainichi Kiko). 


A robotok történetének harmadik nagy korszakát a robotok intelligenciájának növekedése, 
az érzékelési, a hajtási és az irányítási rendszerek nagymértékű továbbfejlesztése jellemzi. A 
korábbi komplikált kinematikai áttételek részben kiküszöbölhetőkké váltak a hagyományos 
váltóáramú motoroknál előnyösebb egyenáramú, illetve léptetőmotorok alkalmazásával. A 
robotok irányítástechnikájában elterjedtek az ún. hierarchikus megoldások: ezek központi 
vezérlőegységen és lokális hajtásszabályozókon alapultak. Megjelentek az első robotprog- 
ramozási nyelvek. Általánossá vált a legkülönbözőbb szenzor-rendszerek felhasználása, és 
azok jeleinek kezelése a robotvezérlés részéről. E műszaki fejlesztéseknek köszönhető, hogy 
a robotok alkalmazási köre a hagyományos anyagmozgatási, szerszámgép-kiszolgálási, fes- 
tési és hegesztési funkciókon túl kibővülhetett a laboratóriumi, mélytengeri és ürkutatásbeli, 
mezőgazdasági, és főleg a szerelési folyamatokkal is. 


11.3. Robot definíció 


Végül eljutottunk a mai értelemben vett ipari robot fogalmáig, amelyet azonban a különböző 
országokban ma még kissé más és más módon határoznak meg. Példaként idézzük a 
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A Nemzetközi Szabványosítási Szervezet (ISO) robotdefiníciója: , Az ipari robot au- 
tomatikus helyzetszabályozással ellátott, újraprogramozható, többfunkciós, több szabadsági 
fokú manipulátor, amely képes anyagok, szerszámok, alkatrészek vagy speciális készülé- 
kek mozgatására változtathatóan programozott mozgások sorozatán át, különféle feladatok 
megoldása céljából. Egy vagy több karja van, mely(ek) csuklóban végződik (végződnek). 
Irányítóegysége memóriát tartalmaz, és gyakran érzékelő és adaptációs eszközöket alkalmaz, 
hogy figyelembe tudja venni a környezetet vagy a körülményeket. Ezeket a többfunkciós 
gépeket általában ismétlődő feladatok elvégzésére tervezik, és alkalmazhatók más feladatok 
ellátására is, a berendezés állandó átalakítása nélkül." 

Az eddigi fejlődés megfigyeléséből levonható egyik következtetés, hogy a robotizáció 
alakulásában a legfontosabb tényező maga a műszaki fejlesztés és annak eredményessége. 
Az alkalmazások körének további bővülését egy-egy konkrét típus esetében általában nem 
gazdasági korlátok akadályozták meg, hanem magának az adott konstrukciónak a műszaki 
alkalmatlansága komplikáltabb feladattípusok megoldására. Amint a műszaki fejlesztésben 
döntő áttörés következett be valamilyen területen, s ez műszakilag lehetővé tette az alkalma- 
zási területek kibővítését, a gyakorlat mindig élt is az új lehetőségekkel. 

A robotot tekinthetjük egy aktív mesterséges ágensnek, aminek környezete a teljes fizikai 
világ. A robotok azon beavatkozók és érzékelők alapján különböztethetők meg egymástól, 
amikkel fel vannak szerelve. 


1. Erzékelők: az érzékelés eszközei 


e Önérzékelés: Az emberhez hasonlóan a robotoknak is van egy saját, proprioceptív 
(saját belső érzékelés) érzete, ami megmondja neki, hogy saját csuklói hol 
találhatók. A csuklókhoz tartozó kódolók nagyon pontos adatokat szolgáltatnak 
azok szögéről és kiterjedéséről. Amennyiben mozgás alatt a kódoló kimenetét 
visszacsatoljuk a mechanizmus vezérlőjéhez, a robot az embernél sokkal nagyobb 
pontossággal tud pozicionálni. 


Erőérzékelés: Noha a robotok az embernél sokkal pontosabban képesek érzékelni 
lyeket csupán pozícióérzékeléssel nem lehet megoldani. Például tekintsük azt 
a feladatot, amikor borotvapengével az ablaküvegről kell lekaparnunk a festék- 
maradékot. Az összes festék leszedéséhez az szükséges, hogy a pozicionálás az 
üvegre merőlegesen, ezredmilliméter pontossággal történjen. Egy milliméteres 
pozicionálási hiba azt okozhatja, hogy a robot egyáltalán hozzá sem ér a festékhez 
vagy betöri az üveget. 

Ez és sok más érintkezést igénylő feladat, így az írás, az ajtónyitás, a jármű- 
összeszerelés szükségessé teszi az erő pontos meghatározását, vezérlését. A 
pontos szabályozáshoz erőérzékelőkre van szükség. Ezeket a villanymotorokat 
rendszerint a manipulátor és a beavatkozók közé helyezik el, és ezek az erőt és a 
nyomatékot hat irányban tudják érzékelni. 


Taktilis érzékelés: A taktilis érzékelés az emberi tapintás robot változata. Egy 
papír pohár felemeléséhez vagy egy pici csavarnak a becsavarásához a saját 
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maga érzékelésénél többre van szükség. Az alkalmazandó erőnek elegendően 
nagynak kell lennie ahhoz, hogy a pohár ne csússzon el, de nem lehet túl nagy, 
nehogy összenyomja azt. A csavar megfogásához pontosan tudni kell, hogy az 
azt érintő ujjakhoz képest hol helyezkedik el. Mindkét esetben a taktilis érzékelés 
(tapintásalapú érzékelés) az, ami a szükséges információkat biztosítja. 


Hanglokátor: A Sonar(hanglokátor) mozaikszó, a Sound Navigation and Rang- 
ing, hang szerinti tájékozódás és besorolás rövidítése. A hanglokátor hasznos 
információkat szolgáltat a robothoz nagyon közeli tárgyakról, gyakran az ütkö- 
zések elkerülését biztosító vészjelző szerepét tölti be. Időnként a robot tágabb 
környezetének feltérképezésére is használják. A hanglokátor azt az időt méri, 
amely alatt az érzékelő által kibocsátott hangimpulzus a tárgyról visszaverődve 
visszaérkezik. 


2. Beavatkozók: a cselekvés eszközei 


Beavatkozónak nevezzük mindazokat az eszközöket, amelyek a robot irányítása alatt 
valamilyen hatást gyakorolnak környezetükre. A fizikai világra történő hatás gyakorlá- 
sához a robotokat olyan működtetőkkel kell felszerelni, amelyek a szoftver parancsokat 
fizikai mozgássá alakítják. Maguk a működtetők tipikusan villanymotorok, hidraulikus 
vagy pneumatikus munkahengerek. A beavatkozókat alapvetően kétféleképpen hasz- 
nálhatjuk: 


e a robot helyzetének saját környezetében való megváltoztatására, 


e. valamely objektumnak a környezetben történő mozgatására. 


A robottechnika alapjairól az érdeklődő olvasó [8]-ben olvashat bővebben. 


11.4. Robottípusok és alkalmazásuk 


A gyártásautomatizálás terén ható pusztán piaci kényszereken kívül ma a technológiai 
fejlődéssel párhuzamosan egyéb, a robottechnika alkalmazását szintén serkentő körülmények 
is megjelentek. Az emberi munkaerő, egészség mint érték fenntartásának költségei jelentősen 
megnőttek. Ebből a szempontból az új, emberre és környezetére veszélyes, ártalmas 
technológiák, valamint a nagy tisztaságú, az emberi életfolyamatok által veszélyeztetett 
technológiák megjelenése is döntő. Tipikusan ilyen terület a korrózióvédelem, galvánozás, 
festés, ragasztás, a mérgező anyagaik kipárolgásai miatt veszélyes hulladékok kezelése, atom- 
erőművek üzemeltetése, és egyéb sugárveszélyes technológiák, biotechnológia, baktérium- 
és vírustenyészetekkel végzett munka, nehézipari, nehézüzemi, melegüzemi alkalmazások 
(acélipar), nyersanyag kitermelése az emberen maradandó károsodást okozó környezetben 
(pl. mélytengeri robotok), ürtechnológia, s minden olyan környezetben végzett munka, 
amelyben az emberi élet fenntartásának költségei extrém magasak. Tipikus példák továbbá 
speciális élelmiszeripari alkalmazások, termékek nagy tömegben történő feldolgozására (pl. 
halfeldolgozás), illetve egyenletes munkatempóban a termék romlékonysága miatt nem 
végezhető idénymunkákra (pl. gyümölcsök csomagolása stb.). 
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A következőkben a definíciók felsorolása helyet néhány szempont szerint bemutatjuk a 
robotok csoportjait. 


1. Fejlettségük szerint: 


I. generációs robotok: 1960-as évek. Felemelés-lerakás típusú feladatokra alkalmazták 
őket. A környezet változásait vizsgáló külső érzékelőkkel nem igen rendelkeztek. Ha 
igen, akkor azok csak védelmet biztosítottak. A programozhatóság alacsony szintű 
volt, a robot mozdulatait a program egyértelműen meghatározta. 

II. generációs robotok: 1970-es évek. Ezek már környezetüket érzékelők segítségével 
vizsgálják és tevékenységüket a vett jelek alapján a pillanatnyi szituáció figyelembe- 
vételével módosítani tudják. Feladataikat magas szintű robotprogramozási célnyelven 
lehet meghatározni. 


III. generációs robotok: 80-as évektől. Itt már nagyobb szerepet kapnak a mesterséges 
intelligencia elemei. Az érzékelőktől származó jeleket feldolgozzák, a magukról és a 
környezetről tárolt modellt képesek intelligens módon, önállóan módosítani, képesek 
információ kiválasztására és kombinálására. Megjelennek az önálló viselkedési algo- 
ritmusok és a döntési rendszerek. E generáció működésére az összetett tevékenység és 
a feladatok magas szintű, általános megfogalmazása jellemző. 


Az iparban alkalmazott robotok nagy része a második generációba soroltakból kerül 
ki. A harmadik generációs tulajdonságú robotok főleg kutatási területeken találhatók 
meg. 


2. Feladatkörük szerint: 


e 4 termelésben használt robotok lehetnek: 


— Anyagkezelő robotok 
Feladatuk munkadarabok és műveleti eszközök manipulálása (általában a 
műveletek szünetében). 
Jellegzetes feladatok: 


t adagolás megmunkálógépre, 

t megtartás, forgatás (operációhoz, vagy operáció alatt), 
t áthelyezés program szerint, 

kt válogatás, rendezés, 

X szerszámozás, szerszámcsere, 

t mérőeszköz csere. 


— Műveletvégző robotok 
Feladatuk műveleti eszközök operatív mozgatása. 
Jellegzetes alkalmazások: 


k festés, tisztítás, sorjázás, 

kt pont- és vonalhegesztés, varratlerakó hegesztés, 
kt fúrási, marási műveletek (11.3. ábra), 

k lézeres megmunkálási műveletek, 
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: láng- és plazmasugaras vágás, 


t mérőeszköz mozgatás, mérés kiszolgálás. 





11.3. ábra. Maró, esztergáló robot az iparban 


— Szerelő robotok 
Feladatuk munkadarabok és műveleti eszközök manipulálása, mozgatása. 
Általában szenzorokkal rendelkeznek. 
Jellegzetes feladatok: 


x alkatrészek kiválasztása, 

x alkatrészek orientálása, 

x alkatrészek összeillesztése, helyezése, 
x kötések létesítése. 


e A kutatásban használt robotok (11.4. ábra) többnyire: 
telerobotok, távvezérelt manipulátorok, mobilrobotok. 





11.4. ábra. Űrkutatásban használt robot 


e Speciális feladatok megoldására alkalmazott robotok és egyéb robotrendszerek: 


mikrorobotok, gyógyászatban alkalmazott robotok (11.5. ábra), oktatásban hasz- 
nálható robotok (11.6., 11.7. ábrák), szórakoztató robotok (11.8. ábra) stb. 
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11.6. ábra. Lego mindstorms robot építő eszközkészlet I. 


3. Felépítésük szerint: 

Robotkarok, manipulátorok: Helyhez kötött robotkarok, melyeket egy művelet, vagy 
műveletsorozat végrehajtására programoznak. A robotkar elemei izületekkel kapcso- 
lódnak egymáshoz. Az izületek és karok elhelyezkedése alapján a következő típusokat 
különböztetjük meg. 

(a) derékszögű koordinátás kar (11.9. ábra) 

(b) hengerkoordinátás kar (11.10. ábra) 

(c) gömbkoordinátás kar (11.11. ábra) 

(d) SCARA kar (11.12. ábra) 

(e) humanoid kar (11.13. ábra) 
Mobilrobotok: Helyhez nem kötött robotok. Általában nem ipari szerelési, techno- 
lógiai vagy anyag-mozgatási feladatokra készülnek. Rendszerint kutatási feladatokat 


látnak el, ugyanis képesek olyan helyeket is felkeresni, ahová az emberek — valamilyen 
oknál fogva — nem juthatnak el. A mobilrobot feladata sok esetben nem egzakt 
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11.8. ábra. A szórakoztató robotok egyik típusa 


módon definiált, nemegyszer csak , menj és gyűjts adatokat" típusú. A mobilrobotokat 
komplex problémák megoldására tervezik. Két nagy csoportjuk a kerekes és a járó 
robotok. 
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11.9. ábra. Derékszögű koordinátás kar 





11.11. ábra. Gömbkoordinátás kar 





11.12. ábra. SCARA kar 
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11.13. ábra. Humanoid kar 
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12. fejezet 


Virtuális valóság 


12.1. Alapok 


A virtuális valóság olyan ember-számítógép kapcsolat, amely a valósághű térbeli megjeleníi- 
tésre és érzékelésre épül, és magas fokú interaktívitásával azt az illúziót adja a felhasználónak, 
mintha ő valójában részese lenne a számítógép által generált környezetnek. 

A virtuális valóság kifejezés két szóból áll, ahol a virtuális látszólagos, nem létező, nem 
valós jelentéssel bír, míg a valóság azt fejezi ki, hogy egy tárgyat érzékszerveink közül 
legalább az egyikkel érzékelünk. 


12.2. Definíciók 


A virtuális valóság (virtual reality — VR) olyan számítógépes szimuláció, amely kiterjed 
szinte valamennyi emberi érzékszervre és azokat aktívan manipulálja. [7] 
A virtuális valóság rendszer részet: 


e az ember 


a számítógép 


a virtuális környezet 


e. a bemeneti egységek 


a kimeneti egységek 
e a hálózat. 


Virtuális környezet: olyan számítógépen megjelenő 3 dimenziós modell, mely különbö- 
ző fizikai tényezők (alak, szín, pozíció, textúra stb.) és részletek megadásával jön létre. 

Az egyik legfontosabb kérdés a tárgyak viselkedésének leírása: Leesik, ha leejtik? 
Bekapcsol, ha megnyomunk egy gombot? 

A valósidejű, dinamikus, interaktív képesség tesz különbséget a virtuális valóság rendszer 
és a 3 dimenziós képek között. (12.1. ábra) 
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12.1. ábra. Virtuális környezet 


12.3. Az érzékelés folyamata 


Mivel a virtuális valóság rendszerek kialakításához, használatához szorosan kapcsolódnak az 
érzékelés különböző formát, ezért röviden kell, hogy érintsük az érzékelés folyamatát. 


1. A látás hordozza környezetünkről a legtöbb információt. 
A látás manipulálásához 
e valós időben létre kell hozni egy állandóan változó (a nézés irányától is függő) 
képet, 
e a képet a szembe kell juttatni, 
e a térbeli tájékozódáshoz érzékszervi együttműködést kell szimulálni. 
Az állandóan változó képhez nagy teljesítményű, valósidejű képfeldolgozást kell 
megvalósítani. 


A térbeli tájékozódásban a látásnak ugyancsak fontos szerep jut. Egy bonyolult 
visszacsatolási folyamat eredményeként érzékeljük térbeli helyzetünket és ebben a 
látás, a hallás, az egyensúlyérzet és a tapintás játszik szerepet. Ez az integrált 
érzékszervi rendszer több millió éves evolúció eredménye, ezért manipulálása nehéz 
feladat. A legkisebb hiba is furcsa jelenségeket produkál, az illető émelyeg, fáradt, 
tériszonya van stb. Az ilyen jelenséget szimulátor-betegségnek nevezik. 


2. A hallás útján való érzékelés szimulációja kevesebb gondot okoz, mivel ezzel kapcso- 
latban jóval több információ, kutatási eredmény áll rendelkezésre, mint a látás esetén. 


3. A tapintási és kinesztetikus ingerek szimulációja területén jelentős a lemaradás. Ide 
tartozik a bőrre ható nyomás, a hőérzet és a fájdalom szimulációja. Ezeken a területeken 
még nagyon sok munkájuk van a kutatóknak, fejlesztőknek. 
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12.4. A virtuális valóság rendszerben használható eszközök, 
megoldások 


1. Bementi eszközök 


A felhasználó irányítani tudja a nézőpontot és kapcsolatba tud lépni a virtuális környe- 
zettel. Fontos, hogy a természetes kommunikációhoz a lehető legközelebb álljanak. 


e A test mozdulatainak nyomon követése: 


— A legelterjedtebb eszközök rendelkeznek egy küldővel, amely mágneses 
mezőt hoz létre, melynek egyedi szenzorait a felhasználó testére erősítik, és 
ez információkat tud szolgáltatni a pozícióról és az elfordulásról. 


— Így a számítógép nem csak azt tudja, hol helyezkedik el a fej vagy a kéz, 
hanem azt is, hogy az merre mutat vagy néz. 

— Vannak eszközök, amelyek ultrahangos szenzorok, optikai érzékelők vagy 
kamerák segítségével érzékelik a kívánt információkat. 


e Mozgás a virtuális környezetben: 


Használhatunk ún. belemerítő VR irányító eszközöket. Ez azt jelenti például, 
hogy a mozgást nyomon követő szenzorok a felhasználó lábára erősíthetők, majd 
egyhelyben gyalogolva szimulálható a valós mozgás (séta, futás). 


Asztali VR irányító eszközök: 
Sokkal több fejlettebb és pontosabb mozgást előidéző asztali irányító eszköz 
létezik (12.2. ábra): 

— spacemouse 

— spaceball 

— cyberpuck 


joystick 


4 
vé " h 
. ; 


ú B 


12.2. ábra. Mozgást előidéző asztali irányító eszközök 





A virtuális térben — ahogy a valóságban is — 3 szabadsági fok van az irányokra 
(mozgásokra) és 3 a forgásokra. Az irányok általában x, y, z, míg a forgások 
csavarodás, elhajlás és elfordulás. A 6 szabadsági fokú eszközök lehetővé teszik, 
hogy a felhasználó nézőpontját bármerre elmozdítsa, vagy fordítsa. 
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e Kontaktus a tárgyakkal: 


Az egyik leggyakrabban használt eszköz az adatkesztyű (dataglove), amely 
esetében a kéz gesztusait használhatjuk a kapcsolatteremtésre. Az ilyen kesztyűk 
(12.3. ábra) többsége száloptika segítségével érzékeli az ujjak behajlítását vagy 
ujjvégekkel történő kapcsolást (két ujjbegy összeérintését) tesz lehetővé. 





12.3. ábra. Adatkesztyű 


A jövőben cél a bemeneti eszközök használhatóságának a növelése. Így például 
hasznos lehet adatkesztyű és szenzor nélkül a fej és akéz mozgásának a meghatározása 
vagy a beszéd és az egyértelmű gesztusok felismerése. 


2. Kimeneti eszközök 


A kimeneti eszközök a környezetnek az érzéki megtapasztalását teszi lehetővé. Olyan 
eszközöket terveznek és fejlesztenek ebben a körben, amelyek összeegyeztethetők az 
emberi érzékeléssel. 


e Vizuális eszközök 


— Belemerülés 

Alapvetően kétféle lehetőséget említhetünk meg. Az egyiknél projektorok és 
tükrök segítségével vetítjük magunk köré a virtuális világot. A felhasználó a 
középpontjában áll, így teljesen el tud merülni a virtuális térben, mivel látó- 
terét teljesen lefedi a virtuális környezet (12.4. ábra). A másik esetben egy 
ún. Head Mounted Display-t (HMD) használhatunk (12.5. ábra), amely csak 
egy felhasználó esetén alkalmazható. Az eszköz két vékony képernyőből áll, 
egyik az egyik, a másik a másik szemnek. A képernyőkön kívül szükség van 
lencsére is ahhoz, hogy a szem megfelelően tudjon fókuszálni (sztereóban) a 
látottakra. Ezzel az eszközzel a teljes látóteret nem tudjuk lefedni. 


— Nem belemerítő technika 
Ide tartoznak a standard asztali számítógépek mint megjelenítők. 

— Sztereó kép létrehozása 
Ahhoz, hogy mindkét szem a számára megfelelő képet kapja, speciális 
hardverre van szükség. Ez lehet folyadékkristályos rekesz szemüveg (LCS), 
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12.4. ábra. Munka a virtuális térben 


amellyel a felhasználó mélységet is lát a képernyőn. A 3D-s, PC-s videó- 
kártyákra alapozva kifejlesztettek egy olcsóbb megoldást is, amely egy vagy 
két projektor polarizált fényét és hozzá olcsó, polarizált szemüveget használ. 
Ez egy passzív sztereó eszköz, mivel nincs benne elektronika. Ilyen a 3D 
anaglyph szemüveg (12.6. ábra), amely esetében a képszeparáció színszűrő 
segítségével történik. A szűrő például piros és cián színű. 





12.5. ábra. Head Mounted Display 


Audió eszközök 

Ezek az eszközök a hangok generálására és a térbeli hely meghatározáshoz 
szükségesek. A tökéletes virtuális környezet élmény létrehozásához szükségesek 
a hangefektek, melyek erősítik a valóságérzetet. A PC-s hangkártyák egyre 
nagyobb mértékben támogatják a surround hangzást. (12.7. ábra) 
Érzékelő-tapintó eszközök 

Ezen eszközök segítségével lehetőségünk nyílik a virtuális környezet érzékelésére 
is. Használhatunk pl. ún. erő-visszacsatoló joystick-et vagy mellényt (12.8. 
ábra). Az elektromos tapintást támogatják a különböző kesztyük. Ha a hatást 
fokozni akarjuk ún. kevert valóságot (mixed reality) is létrehozhatunk, például 
ilyen lehetőséget alkalmaznak a repülés szimulátoroknál, ahol keverednek a vir- 
tuális (az ablakból látott látvány) és a valós elemek (irányító eszközök, műszerek). 


Egyéb eszközök, lehetőségek 
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12.6. ábra. 3D anaglyph szemüveg 


Dolby Digital 5.1 oder DTS 5.1 





12.7. ábra. Hanghatás eszközei 


Itt megemlíthetjük a szagláshoz kapcsolódó ingereket, de ez a terület még 
gyerekcipőben jár, még sokrétű kutatásra van szükség a kellő hatás eléréséhez. 
De megemlíthetjük a teljes test mozgatását, amit a repülőgép szimulátorokban 
már régóta használnak. 


3. Hálózat 


A hálózat szerepe, hogy megteremtse annak a lehetőségét, hogy ugyanazt a virtuális 
környezetet többen használják a saját számítógépükön, akár az interneten keresztül. 
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12.8. ábra. Erő visszacsatoló mellény 


12.5. Alkalmazási területek 


Biológia 

Az egyik kiemelkedő terület a génsebészet, melynek a célja új, jobb és életképesebb 
fajok létrehozása a növénytermesztésben. A géneket a VR eszközeivel megfelelően tudják 
ábrázolni és tanulmányozni. 

Orvostudomány 

Többek között megemlíthető a virtuális valóság vírusok és rendellenességek gyógyításá- 
ban játszott szerepe. Emellett a sebészetben (12.9. ábra), a sebészeti beavatkozások meg- 
tervezésében nyújthat segítséget a VR. Orvostan hallgatók virtuális gyakorlatokon vehetnek 
részt, ahol virtuális emberi testeken végezhetnek műtéteket, következmények nélkül. 





12.9. ábra. Műtét a virtuális valóság segítségével 


Pszichológia 
A fóbiák gyógyítását említhetjük első helyen. A pácienseket szembesíteni tudják legsú- 
lyosabb félelmük tárgyaival (magas épületek, hidak, bogarak stb.). De nemcsak a betegek 
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szemléletének a megváltoztatására tudják felhasználni, hanem az emberi magatartás tanul- 
mányozására 1s. (12.10. ábra) 





12.10. ábra. Fóbiák gyógyítása 


Kémia 

A bonyolult, nehezen elképzelhető és csak drága műszerekkel vagy költséges eljárásokkal 
megnézhető molekulák modelljeit lehet tanulmányozni. (12.11. ábra) 

Gyógyszervegyészet 

A VR segítségével a gyógyszereknek az emberi testre gyakorolt hatását vizsgálhatjuk. 

Oktatás 

A legelső VR alkalmazások is oktató céllal készültek, amelyet a hadsereg alkalmazott, 
igaz nem túl békés célokra. Az oktatásnak nincs olyan területe, ahol ne lenne szükség a 
3 dimenziós megjelenítésre, korszerű szemléltetésre és magas fokú interaktivitásra. A VR 
berendezések és oktató programok elég költséges mivolta miatt az egyéb oktató módszerekkel 
szemben egyenlőre még hátrányban vannak. 





12.11. ábra. Munka egy virtuális kémiai üzemben 


Virtuális szolgáltatások 
Itt több alkalmazási kört is megemlíthetünk, amelyek számos területen nyújthatnak 
könnyítést számunkra. 


e üzleti alkalmazások (pl. elektronikus kereskedelem), 


e reklám, 


www.tankonyvtar. hu oO Piglerné Lakner Rozália, Starkné Werner Ágnes, PE 


12.6. VIRTUÁLIS VALÓSÁG SZERKESZTŐ PROGRAM 101 





e videokonferencia (12.12. ábra), 





12.12. ábra. Virtuális konferencia 


e távoktatás, 


e szórakoztatóipar — játékok, filmek (12.13. ábra) stb. 





12.13. ábra. Virtuális valóság eszközökkel megvalósított mozi film 


Mindezeken kívül még számos alkalmazási területet említhetünk, így az ürkutatást, hadi ipart, 
tervezést, fizikát, geográfiát, meteorológiát, informatikát, médiakutatást, nyelvészetet stb. 


12.6. Virtuális valóság szerkesztő program 


A virtuális valóság szerkesztő eszközök közül egy programozási nyelvet emelnénk ki. Az 
érdeklődő olvasó számos a témához kapcsolódó könyvet találhat, így például [3], [6] és [14]- 
et. A VRML nyelv (Virtual Reality Modeling Language) egy általános, szöveg alapú nyelv, 
amelyet speciálisan 3 dimenziós objektumok készítésére terveztek. Különböző platformokon 
használható, így UNIX, Mac vagy Windows rendszer alatt. Segítségével készíthetünk három- 
dimenziós szövegeket, speciális 3D világokat építhetünk fel és különböző 3D jelenetsorokat 
jeleníthetünk meg. Minden információ egyetlen egy szöveges fájlban tárolódik. A VRML 
programok elkészítéséhez használhatunk segítség képpen számos szerkesztő programot (pl. 
LVIEW, AC3D, RenderSoft, VRML Editor stb.). A VRML segítségével definiálhatunk: 
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egyszerű mértani alakzatokat (kocka, gömb stb.), 


ezeknek felületet, 


tulajdonságokat adhatunk meg, 


átlátszóságot, fény visszaverő képességet szabályozhatunk, 


különböző transzformációkkal (mozgatás, forgatás) elhelyezhetjük azokat végleges 
helyükön, 


különböző szögekből bevilágíthatjuk, 


más terekre mutató hivatkozásokkal komplex, sok részből álló világokat hozhatunk 
létre. 


A felhasználók a 3D világokat böngészővel vagy segédprogrammal kiegészített webbön- 
gészőből nézhetik meg és barangolhatják be (pl. Cosmo Player, Cortona Player, Live3D, 
VRML 2.0 Viewer stb.). 
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13. fejezet 
Gépi látás 


13.1. Alapok 


Közismert tény, hogy érzékszerveink közül szemünk közvetíti számunkra környezetünkről 
a legtöbb információt. Az is közismert azonban, hogy látásunk nem csupán szemünknek 
köszönhető: bonyolult, sok összetevőből álló együttműködés eredményeként ismerjük fel a 
tárgyakat, tájékozódunk, olvasunk. Talán akkor tévedünk a legkisebbet, ha úgy tekintjük, 
hogy látásunk idegrendszerünk komplex megnyilvánulásainak egyike, melyben az érzékelés 
és a feldolgozás összemosódik. Ha mesterséges látásról hallunk, akkor általában annak 
eszközei és a legismertebb alkalmazási példák — optikai karakterfelismerés, minőségel- 
lenőrzés, robotvezérlés — jutnak eszünkbe. Ma még nem tartjuk természetesnek, hogy a 
mesterséges látás ugyanolyan összetettségű információgyűjtést és feldolgozást jelenthetne, 
mint az élőlények esetében. 

A mesterséges látást célzó számítógépes képfeldolgozás a matematika, elektronika és 
számítástechnika egyik legizgalmasabb, leggyorsabban fejlődő alkalmazási területe. A látás 
teljes automatizálása egyelőre csak távlati cél, de a kutatást és a fejlesztést különösen 
izgalmassá teszi, hogy a lehetőségek messze túlmutatnak a biológiai látás lehetőségein. 

A legerősebb számítógépnek is nagyon sok időre van szüksége, hogy egyetlen statikus 
képet interpretáljon. A Neumann-elvű számítógépek képtelenek erre a teljesítményre. A 
jövőben a technika és a számítástudomány fejlődésével ezen probléma megoldása lehet 
a valós idejű képfeldolgozás igényeihez szabott kép-processzor, a párhuzamos struktúrájú 
számítógépek, a kvantum számítógépek megjelenése, speciális eljárások, algoritmusok hasz- 
nálata. 

A mesterséges látás kezdettől fogva kiemelt szerepet játszott a számítástechnika gya- 
korlati alkalmazásában. A kezdeti dedikált (drága) alkalmazások korszakán túljutottunk, s 
ma már pl. a kiadványszerkesztés, automatikus minőségellenőrzés, orvosi képfeldolgozás 
hétköznapi alkalmazásnak számít. A fejlődést az is jelzi, hogy a képi információ szerepe a 
tárolt, továbbított adatformátumok közt folyamatosan nő. 

A gépi látás témakörében a magyarországi fejlesztők már néhány világhíres termékkel 
is előrukkoltak. Ilyen például az optikai karakterfelismerés területén a Recognita program- 
rendszer. Számos olyan megoldás készült ipari, orvosi, mezőgazdasági, biztonságtechnikai 
területekre, amelyek nemzetközi összehasonlításban is kiemelkedőek. 
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Nagy általánosságban azt is mondhatnánk, hogy minden olyan információközlés látás, 
mely számunkra a 3D (háromdimenziós) környezet objektumainak alakjáról, helyéről ada- 
tokat közvetít. A továbbiakban ugyan elsősorban a megszokott (a fény visszaverődésén és 
érzőkelésén alapuló) látásról lesz szó, érdemes azonban elöljáróban egy nagyon rövid kitérőt 
tenni, mi minden tartozhat még ebbe a témakörbe. (A továbbiakban egy összefoglalóját adjuk 
meg ennek a területnek. Az érdeklődő olvasó például [17]-ben és [11]-ben olvashat további 
részleteket.) 


13.2. A gépi látás területei 


Jelenlegi képalkotó eszközeink többsége felületi információ felhasználásával működik, és 
mi magunk is így látunk. Ez azt jelenti, hogy az objektumok belsejéről többnyire nem áll 
rendelkezésünkre adat. Ezért látáson eleve az objektumok felszínének érzékelését értjük. 
Pedig ez nem szükségszerű; elég, ha arra gondolunk, hogy átlátszó, illetve áttetsző testek 
esetében a belső szerkezetet is láthatjuk. Ha látásunk pontszerű kölcsönhatáson alapulna, 
nem pedig valamilyen közvetítő közegen keresztül hozzánk jutó sugárzás érzékelésén, 
akkor akár közvetlenül láthatnánk a dolgok belsejét, szerkezetét. Jelenlegi ismereteink 
szerint ilyen fizikai kölcsönhatás nem létezik, így ez a gondolat látszatra felesleges kitérő. 
Valójában azonban a látás folyamatában nem különíthető el, hogy mi köszönhető a fizikai 
kölcsönhatásnak, és mi a nyert adatok feldolgozásának. Megfelelő technikai eszközök és 
feldolgozó algoritmusok alkalmazásával ma is lehetséges a térbeli objektumok belsejének 
rekonstruálása, legalábbis ami az anyageloszlást és a fizikai tulajdonságokat illeti. Így 
könnyelműség lenne a mesterséges látást azonosítani azzal a felületlátással, amit a biológiai 
látás esetében megszoktunk: a mesterséges látás akár valódi térbeli látás is lehet. 

Nézzünk egy másik példát. Az élőlények többsége rendelkezik a színlátás képességével, 
tehát a fényt viszonylag széles frekvenciatartományban érzékeli. A biológiai látás azonban 
messze nem nyújtja azokat a lehetőségeket, melyeket például a műholdak készítette többsávos 
képek számítógépes feldolgozása nyújt. Ez ugyanis a frekvenciafüggést leíró, spektrális 
reflektanciafüggvény osztályozása útján anyagfajták kvantitatív meghatározására is alkalmas. 
Továbbá az élőlények egy részénél nemcsak a látható fény, hanem pl. ultrahang terjedésén, 
illetve statikus elektromágneses tér torzulásának érzékelésén alapuló , látás" is kifejlődött. 
Technikai eszközeink ennél jelenleg is jóval többet , tudnak": az elektromágneses hullámok 
teljes spektrumán kívül különböző elemi részecskék áthatoló sugaraival is látnak, így a 
megfigyelt objektumok mérete molekuláris szinttől a csillagrendszerekig terjedhet. 


13.3. Digitalizálás 


A számítógépes képfeldolgozás előfeltétele, hogy a valós világ objektumainak képét számí- 
tógéppel kezelhető adatokká lehessen alakítani. Ezt az átalakítást nevezzük digitális képal- 
kotásnak, más szóval: digitalizálásnak. A digitális képalkotás célja a valóságos tér (T, y, 2) 
koordinátájú pontjaiból ? időpillanatban visszaverődött, a színű összetevőket tartalmazó — a 
megfigyelés irányától (A) is függő erősségű — fénysugarak által közvetített természetes kép 
számítógépes megfelelőjének létrehozása. Ennek a műveletnek az e(2, y, z, t, A, n) folytonos 
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függvény adja a bemenő adatait, kimenetén pedig Ín x m] darab képpontot tartalmazó tömb 
jelenti a kimenő adatokat (ahol n és m a kép , méretei", azaz a sor illetve oszlop irányú 
képpontszám). Az f(Tz,y) képfüggvény értelmezési tartománya folytonos; a függvény az 
(z,y) sík azon pontjain van értelmezve, ahová a leképezés történt. (A TV-technikában 
szokásos megjelenítési mód miatt a képsíkon az T-tengelyt balról jobbra, az y-tengelyt pedig 
általában felülről lefelé értelmezik, az origó pedig a feldolgozandó kép bal-felső sarkába esik. 
A kép általában téglalap alakú.) A képfüggvény értékkészlete folytonos, pozitív-definit és 
korlátos. Mivel a leképezés a gyakorlatban nem egy adott frekvencián, hanem egy bizonyos 
sávban történik, a képfüggvény a leképezés spektrális tulajdonságaitól is függ. Ez adott 
tartományban, meghatározott alakú súlyfüggvénnyel (érzékenységgel) történő integrálásnak 
felel meg. Ha a leképezés egyidejűleg több — pl. más-más sávtartományból származó — 
kimenőjelet szolgáltat, akkor a képfüggvény elemei vektorok lesznek. Ez jellemző pl. a 
színes kép bevitelére. 

A következő lépés a mintavételezés, majd pedig a képfüggvény diszkrét képpont- 
értékeinek meghatározása (kvantálás). A mintavételezés — mint művelet — lényegében 
integrálás: minden képpont-érték egy kis terület fényességértékeit integrálja (összegzi) úgy, 
hogy a súlyfüggvény a mintavételezés helyétől távolodva rohamosan csökken. A kvantálás 
a tetszőleges értéket felvevő képpont-értékekhez a megengedett (diszkrét) képpont-értékek 
valamelyikét rendeli. Az eredmény a digitális kép, melynek adatai a képpontok (ún. pixelek). 
A képpont-érték, ill. képpont-értékvektor az adott pontbeli világosságot, illetve színt kódolja. 
Sorirányban n, oszlopirányban pedig m darab képpont alkotja a képet. A digitális kép tehát 
számok, illetve vektorok rendezett halmaza, s így számítógépes feldolgozásra közvetlenül 
alkalmas. Képszerű használatához — pl. megjelenítéséhez, képi másolat készítéséhez — újra 
vissza kell állítani az analóg képet, ami megfelelő eszközök és algoritmusok használatát teszi 
szükségessé. 


13.4. Képjavítás 


A digitális kép érdemi feldolgozása előtt szükség lehet bizonyos előkészítő műveletekre. A 
képjavítási módszerek a megvalósítandó cél szerint két csoportba sorolhatók: 


e A képhelyreállítás célja az, hogy a különböző okok miatt torzult digitális képből 
előállítsuk azt a képet, amelyet a zavaró, torzító hatások nélkül kaptunk volna. 


e A képminőség javítás célja, hogy a digitális képet a további kiértékelés vagy fel- 
dolgozás szempontjából előnyösebb formába alakítsuk. (Megjegyzendő, hogy ezen 
eljárásokat leggyakrabban a látvány javítása érdekéhen alkalmazzák, ami kívül esik 
ugyan a mesterséges látás célkitűzésein, viszont elterjedtsége miatt említést érdemel.) 


Míg tehát az előbbi esetben a cél az, hogy az eredetihez legjobban hasonlító képet állítsuk 
elő, addig a második eljárás — akár ezzel ellentétesen — a további feldolgozás szempontjából 
fontos jellegzetességeket emeli ki. A továbbiakban vizsgáljuk meg egy kicsit részletesebben 
a képhelyreállítás lehetőségeit. 
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13.4.1. Képhelyreállítás 


A képhelyreállításhoz ismernünk kell a zavaró hatásokat leíró képleteket, de legalábbis 
közelítő leírással, modellel kell rendelkeznünk. (A modell alapját például az jelentheti, 
hogy ismerjük a torzítás fizikai hátterét.) A teendő egyszerűen megfogalmazható: meg kell 
határozni azt az inverz transzformációt, amely a zavaró hatásokat közömbösíti, és ezt az 
inverz transzformációt kell alkalmazni a javítandó képre. A gyakorlatban a helyzet sokkal 
bonyolultabb: a torzítás fizikai hátterét általában csak közelítő pontossággal ismerjük, a 
torzítás pedig olyan információveszteséggel jár, mely a tökéletes helyreállítást lehetetlenné 
teszi. A képalkotás zavaró tényezői lehetnek például az optikai rendszer hibái, az érzékelők 
nem lineáris volta, az atmoszférikus hatások és az objektumok elmozdulása. E sokrétűségből 
következően reménytelen az általános modell megalkotása. A képhelyreállítási eljárások 
alkalmazásának másik nehézsége, hogy a felállított modell, illetve az ezen alapuló inverz 
transzformáció rendszerint még egyszetűsített modell esetén is bonyolult, számításigényes 
összefüggéseket eredményez. 


13.5. Geometriai korrekció 


A képhelyreállítási eljárások közül az egyik legalapvetőbb a geometriai korrekció. Általános 
esetben egy (vagy több, geometriai szempontból összetartozó) bemenő kép áttranszformá- 
lását jelenti kimenő kép(ek)re úgy, hogy a képi információ ne sérüljön a megengedettnél 
nagyobb mértékben, miközben a kívánt geometriai összefüggés legalább a megadott pontos- 
sággal teljesüljön. A geometriai korrekció célja szerint lehet: 


e Képjavítás, ekkor geometriai hibákban jelentkező torzítás megszüntetése a feladat, 
például a képfelvevő rendszer optikai hibái, a perspektív torzítás vagy a felvétel közben 
történt elmozdulás miatt. (Általában elmondható, hogy a geometriai korrekcióra, mint 
képjavításra a korszerű képalkotó eszközök fejlettsége miatt csak a különösen nagy 
pontosságot igénylő felhasználási területeken van szükség.) 


e Képkorrekció, ekkor például a képek illesztése, megadott vetületi rendszerbe való 
transzformációja, illetve a helyes méretarányok megvalósítása a feladat. A geometriai 
korrekciók az esetek jelentős részében globálisan (vagyis a teljes képre vonatkozóan) 
nem lineárisak. Emiatt, valamint a jelentős adatmennyiség miatt is jelentős a szá- 
mításigényük. A megvalósításnak a pontossági követelmények teljesítése mellett az 
elfogadható végrehajtási sebesség is alapfeltétele. Szerencsére bizonyos összefüggé- 
sek kihasználásával igen hatékony algoritmusokat lehet kidolgozni (pl. invertálható 
korrekciós összefüggések alkalmazása esetén a szomszédos pontok szomszédosak 
maradnak; lineáris korrekció esetén az egyenesek képe egyenes marad stb.). 


13.6. Alkalmazási területek 


1. Arcfelismerés 
Agyunk az arcokat, valamint az arckifejezéseket alakokról és mozgásokról szerzett 
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információinak az összekapcsolásával ismeri fel. Egyre népszerűbb kutatási területnek 
számít a komputeres arcfelismerés, 4 főbb aspektusra fókuszálnak: 

(a) arcmodellezésre, 

(b) arcfelderítésre és lokalizációra, 

(c) személyek arckép alapján történő azonosítására, 

(d) arckifejezés-felismerésre. 
Arc- és hangulatfelismerő számítógépes rendszerek létrehozása a kísérletek célja. Az 
arcfeldolgozás holisztikusan, és nem lokálisan történik. A személyenként különböző 


(boldog, haragos, üvöltő, semleges kifejezésű, változó fényviszonyok stb. mellett 
felvett) képek alapján létrehoztak egy arc-adatbázist (lásd 13.1. ábra). 


ag? 


13.1. ábra. Példa arc-adatbázisra 





A modell az emberi képfeldolgozás egyszerűsített változatát írja le. Egy beépített 
modul az arcizommozgást méri különböző érzések kifejezésekor, valamint azt, hogy 
például örömnél/bánatnál mennyivel gyorsabb/lassabb a mozgás. Ezt a számítási 
tevékenységet valószínűleg a mi agyunk is elvégzi, azt eredményezve, hogy akárcsak 
a számítógép, némi késéssel azonosít. A kevesebb mozgásból összeálló kifejezések 
azonosítása gépnek, embernek egyaránt könnyebben ment. Minél több volt a mozgás, 
annál nehezebben hajtották végre a feladatot. 


Az arcokat videokamera input alapján felismerő komputer építését tervezik. Akkor se 
jön zavarba, ha több fotó esetén az illető más és más arckifejezéssel néz a nagyvilágba, 
különböző szögekből, eltérő megvilágításban kapták lencsevégre, vagy napszemüveget 
hord esetleg. Az ideális arcfelismerő alkalmazása különböző (tudományos, oktatási, 
hétköznapi stb.) területeken várható, az intelligens megfigyelő rendszerektől kezdve, 
eltünt gyerekek, vagy körözött bűnözők azonosításáig. 


, El tudják képzelni, amikor a komputer azt mondja: zaklatottnak tünsz, miben 
segíthetek?" 


Lásd Agent Portal (http://www.agent. ai). 


2. Orr-egér 


A nose (orr) és mouse (egér) szavak összevonásával kreált nouse (hozzávetőleg: 
orr-egér) a komputerek kéz nélküli használatát célzó eszközét az orr és a szemhéj 
kontrollálja. A mintafelismerésen és a gépi látáson alapuló fejlesztés webkamerákkal 
követi a felhasználó arcmozgását, az orr pedig hajszálpontosan , rábök" a képernyő 
bármelyik pixelére. Egér, joystick lesz belőle. 


Lásd Agent Portal (http://www.agent. ai). 
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3. Gesztus-egér 


Olyan szoftvert fejlesztettek ki, mely egy egyszerű webkamera segítségével azonosít 
bizonyos kézmozdulatokat. A programot akár az egér helyett is használhatjuk, abla- 
kokat helyezhetünk át vele, nagyíthatjuk, kicsinyíthetjük őket. Amikor a hüvelyk és 
a mutatóujjunk összeér a mintázatfelismerő rendszer azonosítja, hogy egy nagyjából 
kör alakú zárt alakzat észlelhető a képen (lásd 13.2. ábra). Attól függően, hogy a 





13.2. ábra. Gesztus-egér működése 


billentyűzet fölött hol helyezkedik el a két összeérintett ujjunk a képernyő megfelelő 
pontja fölött kattintásnak felelteti meg gesztusunkat. A rendszer előnye, hogy egyszerre 
két kézzel is navigálhatunk, ami bizonyos műveleteket, például a képek vagy térképek 
nagyítását, kicsinyítését, vagy éppen forgatását lényegesen megkönnyíti. A gesztus- 
egér használatához ráadásul nem szükséges gépelés közben a billentyűzetről teljesen 
levenni a kezünket. 
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14. fejezet 


Beszédfelismerés 


14.1. Alapok 


A beszéd az emberek közötti legtermészetesebb információátviteli forma. Az ember és a 
gép kapcsolatában is ez lehetne talán a legcélravezetőbb, ha a számítógépekhez jó minőségű 
beszédperifériák állnának rendelkezésre. Manapság meglehetősen nagy az igény arra, hogy 
a számítógépekkel hagyományos úton, beszéd alapján kommunikáljunk. Ahhoz azonban, 
hogy a számítógép fel tudja dolgozni az adott nyelvet, mesterséges intelligenciát kell 
alkalmaznunk. Ezt a folyamatot nevezzük a természetes nyelvek feldolgozásának, idegen 
szóval natural language processingnek (NLP). 

Ez egy rendkívül széles kutatási terület, hiszen hogy egy nyelvet és annak megértését 
lemodellezhessük, a nyilvánvaló programozási tudás mellett nyelvészeti, pszichológiai, ma- 
tematikai ismeretekre is szükség van. A témához kapcsolódóan számos szoftver, alkalmazás 
született, melyek közül kiemelkedő az utóbbi években készült beszélgetőprogramok száma. 
Noha múltjuk egészen az 1960-as évekre nyúlik vissza, az Internet és a társalgóprogramok 
(MSN Messenger, IRC, ICO stb.) fejlődésével az utóbbi évtizedben nőtt meg csak igazán az 
érdeklődés irántuk. 

A továbbiakban vizsgáljuk meg, melyek azok a szintek, amelyeken a beszédet értelmezni 
lehet, s hogyan segíthetnek ezek a felismerésben? 


e Fonetika: milyen hang lehet az? 

e Fonológia: hogyan módosíthatták a hangot a szomszédai, állhat-e itt ilyen hang? 
e Lexika, morfológia: van-e ilyen szó, szóalak? 

e Szintaktika: helyes-e nyelvtanilag ez a szerkezet? 

e Szemantika: van-e értelme? 

e Pragmatika: vajon ebben a szituációban, szövegkörnyezetben miért ezt mondta? 
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SPEECH RECOGNITION 


TN1111 


segmentation Into 
phonemes, the basic 
sound units of words 


audio input 


I PHONEME 
e DATABASE 
statistical modeling 


to classify pnonemes 
and identify words 


L the 
with a 


best match 


LANGUAGE UNDERSTANDING 


, 
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7 
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May 1 tagy 944 TT 900 a end dat? May 1 day A tat 900 árd eat? 
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4 Man 1 hat 14 at lb d ind va? 
PARSES dog? Vág 1 a azo aples bay Év tett" 
alternative parses 


matched against 
past examples 


most likely 


sentence broken into potential 
meaning selected 


grammatical interpretations, 
or parses 


LANGUAGE GENERATION AND SPEECH SYNTHESIS 


Credit Card 
zött ok. Yes 
lva 


jövel Amex 


Mastercard 


"Yes, you con use Visa, 
Amerkan Express or 
Master card." 


guestion classification based on 


sentence planning and generation 
sentence structure and key words 


14.1. ábra. A beszédfelismerés folyamata 


14.2. Egy kis történelem 


Az automatikus beszédfelismerés (Automatic Speech Recognition, ASR) célkitűzése olyan 
szoftver/hardver készítése, amely a beszédjelet írott alakra konvertálja. Az , írógép, amelynek 
diktálni lehet", már a beszéd elektromos jellé alakításának, illetve rögzítésének feltalálása 
óta szerepel a kutatók, feltalálók vágyálmai között, amit mi sem bizonyít ékesebben, mint 
hogy 1930-ban Nemes Tihamér szabadalmi leírást nyújtott be egy berendezésre, amely 
optoelektronikai úton leírja a beszédet. 

1946-ban merült fel először a számítógépes fordítás ötlete, ám csaknem tizenöt évnyi 
kutatás és kísérletezés kellett ahhoz, hogy belássák, a gép csak akkor tud jó fordítást készíteni, 
ha , érti" is a nyelvet, azaz szükség van szemantikai, sőt pragmatikai ismeretekre is. A 
következő évek kutatásaiban a nyelvészek vették át a vezető szerepet, s a kutatás súlypontja 
az elméleti kérdésekre helyeződött át. Megszületett egy új tudományos diszciplína is, a 
számítógépes nyelvészet. 

A század első felében a beszéd vizsgálatát legfőképpen a távközlés motiválta; a telefon- 
társaságoknak ugyanis nagyon komoly érdekük fűződött ahhoz, hogy minél több beszélgetést 
tudjanak továbbítani az adott képességű átviteli csatornákon. A minél hatékonyabb tömörítés 
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(szakszóval: kódolás) érdekében kezdték vizsgálni a beszédhangok szerkezetét, illetve 
a hallás működését. A beszédfelismerésben használt feldolgozási eljárások legtöbbje a 
beszédkódolásból származó módszereken alapszik (14.1. ábra), és maga az automatikus 
beszédfelismerés, mint kutatási ág jelenleg is inkább a villamosmérnöki tudományokhoz, 
semmint a számítástudományhoz tartozik. 

Az ötvenes, hatvanas években a digitális technológia, a számítógépek elterjedése a terüle- 
ten zajló kutatásnak újabb lökést adott. A használt módszerek valamilyen kódolási átalakítást 
végeznek a jelen, majd egyszerű szabályokra vagy letárolt mintákkal való összehasonlításra 
(alakfelismerésre) alapozva hoznak döntést. Többnyire rövid beszédszeleteket próbálnak 
Jfonémaként besorolni, esetleg hosszabb egységeket vesznek (szótagokat, szavakat), de az 
utóbbi esetben az időbeli változatosságot (rövidülés, nyúlás) még nem képesek kezelni. 
Az utóbbira két megoldási javaslat született: az egyik szerint a beszédet fonémákra kell 
szegmentálni, majd pedig a szegmenseket kell felismerni; a másik szerint nagyobb egységeket 
(pl. szavakat) kell venni és az időtengely menti lehetséges torzulásokat ún. dinamikus 
idővetemítéssel kell kezelni. 

A hetvenes éveket az utóbbi megoldás letisztulása és elterjedése jellemzi. Előfeldolgozási 
módszerként megjelenik a lineáris predikció. A szavak beszélőfüggő változatosságának 
leküzdése érdekében többféle klaszterező algoritmus születik az egyetlen szóhoz tartozó 
, beszélőfüggetlen" minta kialakítására. Rendkívül fontos újdonságként megpróbálják a 
felismerés során felhasználni a magasabb szintű (lexikális, szintaktikai, szemantikai stb.) 
információkat. Az ekkoriban fejlesztett, ide sorolandó rendszerek ismeretalapú megközelí- 
téssel igyekeznek az említett szinteket integrálni, struktúrájuk pedig a szakértői rendszerekre 
ekkortájt jellemző munkatábla, esetleg bottom-up vagy top-down architektúra. További 
jellemzője volt e projekteknek, hogy beszédfelismerés helyett beszédmegértésre törekedtek. 
Célkitűzésük az volt, hogy a rendszer helyesen reagáljon az elhangzott utasításra. 

A nyolcvanas években az ismeretalapú rendszerek iránti érdeklődés megcsappant. Fo- 
lyamatos beszéd felismerésére a dinamikus idővetemítési módszert ún. kapcsolt szavas 
felismeréssé egészítették ki az eljárás hívei, a háttérben azonban már készülődött, majd a 
80-as évek derekán történt elterjedésével minden egyéb megközelítést háttérbe szorított a 
rejtett Markov-modell (Hidden Markov Model, HMM) alapú felismerés. Ennek alapja, hogy 
minden felismerendő egységhez (pl. szóhoz) tartozik egy valószínűségi modell, amely egy 
adott megfigyelést (felismerendő szót) valamilyen valószínűséggel generál. A felismerés 
kimeneteként a legnagyobb valószínűséget adó modellt választjuk. Ebből látható, hogy itt is 
összehasonlításon alapuló alakfelismerésről van szó, akárcsak az idővetemítésnél, a HMM 
azonban sokkal jobban tudja kezelni az egyes szavak esetleges kiejtési variánsait; ehhez az 
egyes szavakhoz rendelt modelleket be kell tanítani a szó lehetőleg minél többszöri (és — ha 
van ilyen — többféle) kiejtését tartalmazó mintákkal. E mintákból azután a modell statisztikai 
úton beállítja a paramétereit. 

A kilencvenes években a HMM-alapú rendszerek dominálnak. Az évtized első felének 
talán leglényegesebb eredménye, hogy óriási adatbázisok készültek/készülnek (a világnyel- 
vekre), amelyek segítségével a felismerők rejtett Markov-modelljei egyre több tanítandó 
paramétert tartalmazhatnak, illetve egyre jobban betaníthatók. Az egységes adatbázisok 
lehetővé teszik továbbá a különböző fejlesztőcsoportok felismerőinek megbízható összeha- 
sonlítását. 
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Az utóbbi évek legfontosabb történése pedig az, hogy a multimédia elterjedése, illetőleg 
a processzorok, háttértárak, memóriák kapacitásának növekedése révén immár a személyi 
számítógépek is képesek beszédfelismerésen alapuló alkalmazások futtatására. Ez a terület 
látványos fejlődését hozta, gombamód szaporodnak a beszédtechnológiát kínáló cégek, a 
hangsúly pedig egyre inkább a kutatásról áttevődik az alkalmazásokra. [171], [11] 


14.3. A beszédfelismerés alapproblémája 


Az automatikus beszédfelismerés alapproblémáját rendkívül egyszerű megfogalmazni: ké- 
szítsünk olyan berendezést (programot), amely leírja a bemenetét képező, hanginformá- 
cióként kódolt szöveget. Első hallásra azt gondolhatná az ember, hogy ez az átalakítás 
mechanikusan elvégezhető, de ez sajnos nem igaz. Képzeljük el, amint valaki egy számunkra 
teljesen ismeretlen nyelven beszél, a mi feladatunk pedig egyszerűen csak annyi, hogy 
leírjuk, amit mond. Már a hangok 80-85 százalékának eltalálása is rendkívül jó eredménynek 
számítana. Ebből látható, hogy a beszéd felismerése elválaszthatatlan a nyelvi feldolgozástól, 
sőt talán magától az intelligens gondolkodástól is. Amikor egy szó elhangzik, az ember 
automatikusan összeveti a vélt megfejtést a lehetséges megoldásokkal: milyen hasonló 
hangzású szavak vannak egyáltalán, és melyik a legvalószínűbb ebben a szövegkörnyezetben, 
sőt: ebben a társalgási szituációban? Úgy tűnik, hogy az akusztikai-fonetikai, a szintaktikus 
és a szemantikus feldolgozás az emberi elmében oszthatatlan egységet alkot, és ez teszi a be- 
szédfelismerést az egyik legnehezebb problémává a mesterséges intelligencia tárgykörében. 

Az alábbi tudományok (a teljesség igénye nélkül) mind érintettek az automatikus beszéd- 
felismerés kifejlesztésében: 


e villamosmérnöki tudományok, 
e számítástudomány, 

e akusztika, pszichoakusztika, 

e neurofiziológia, 

e kognitív pszichológia, 

e. fonetika, fonológia, 

e nyelvészet. 


Az automatikus beszédfelismeréssel foglalkozó szakembernek ezek mindegyikéhez kellene 
valamennyit érteni, de legalábbis ezen tudományágak között megfelelő információ áramlás- 
nak kellene lennie, ami jelenleg nem igazán mondható el. 

A fejlesztők számos kihívással találkozhatnak munkájuk során: 


e Akusztikai változatosság: a beszédjelbe bekerülhet a környezetből beszűrődő zaj, 
vagy a jel torzulhat a mikrofon vagy az átviteli csatorna paramétereitől függően. 


e. Beszélők közti változatosság: különböző beszélők hangmagassága, szájüregmérete, 
beszédsebessége, dialektusa stb. meglehetősen különbözhet. 
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" Adott beszélő esetén fennálló változatosság: még ha rögzítjük is a beszélőt, akkor is 
meglehetős eltéréseket mutat a beszéd, hisz a beszélő fizikai és lelki állapota is bele 
kódolódik a beszéd sebességébe, a hang minőségébe, a hanglejtésbe. 


. Fonetikai változatosság: a beszédkeltés során nem rögzített alakú fonémákat fűzünk 
egymás után, hanem folytonosan változtatjuk hangkeltő szerveink alakját, amiből 
következően a szomszédos hangoktól függően a beszédhang megváltozhat. 


14.4. Természetes nyelvű szövegek számítógépes feldolgozá- 
sa 


Az emberek és a gépek nyelve illetve nyelvfeldolgozása közti szakadék áthidalására a 
nyelvtechnológusok különböző módszereket dolgoztak ki a szöveg különböző szintjein. 
Ebben a fejezetben megnézzük, hogy milyen fázisokon halad át a feldolgozás folyamata, 
mígnem a számítógép számára is érthetővé válik egy természetes nyelven megfogalmazott 
szöveg. 


14.4.1. Szegmentálás 


Az első művelet a szöveg szintjén megy végbe. Descartes egyik alapelve az volt, hogy az 
összetettebb problémákat kisebb, kezelhető részekre bontva könnyebb megoldani. Nincs ez 
másként egy szöveg feldolgozása esetén sem. Első lépésként meg kell tudnunk különböztetni 
az egymástól különálló elemeket — egy szöveg esetén a mondatokat, egy mondat esetén a 
szavakat. Ezt nevezzük szegmentálásnak. 

Ez könnyen megvalósítható a szóköz (vagy egyéb elválasztó jelek) kódjának ismerete 
mellett. Ügyelnünk kell mindeközben arra, hogy bizonyos központozó karakterek (például 
a vessző) szintén összetartozó egységek határát jelölhetik, amiknek tagjait a maguk szintjén 
egyben kell kezelnünk, különben könnyen téves következtetéseket vonhatunk le szüklátókö- 
rűségünk miatt. Azaz fel kell tudnunk ismerni, hol húzódnak az egyes egységek határai, és 
hogy az egyes szinteken mit tekinthetünk egységnek. 


14.4.2. Morfológiai elemzés 


A szöveg megfelelő tagolása után a szavak szintjén folytatjuk elemzésünket, mert ahhoz, 
hogy nagyobb egységeket (mondatokat) tudjunk értelmezni, szükségünk van az elemeinek 
világos és egyértelmű megkülönböztetésére. Egy nyelv önálló — tovább nem bontható — 
egységeit, alapelemeit nevezzük morfémáknak. Egy ragozó nyelvben ilyennek minősülnek a 
toldalékok és a szótöves formában (ún. alapalakban) álló szavak. Egy morfémának több 
alakja is lehet, ezeket allomorfoknak hívjuk. A magyar nyelvben például a ló és lov- 
ugyanannak a szónak a különböző allomorfjai. A toldalékok közt a -hoz esetragnak három 
allomorfja is van: -hoz, -hez, -höz. Hogy ezek közül mikor melyiket kell használni, azt a 
megfelelő nyelvi szabályok döntik el. 
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A szavak azonban ritkán fordulnak elő ekképpen, így szükség van a toldalékok levá- 
lasztására. Ehhez általában egy olyan szótárat használunk, ahol fel vannak sorolva az adott 
nyelv szóalakjai, mellettük a lehetséges felbontási szabályok és információk. Azonban az 
olyan nyelvekben, ahol a toldalékolás során rengeteg kivétel fordulhat elő, megnövekedhet 
a szóalakok száma, és megfelelő számítógépes architektúra hiányában nem ábrázolható 
mind a gép számára. Az agglutináló nyelvek, mint a magyar, lengyel, a finn, az észt, 
a japán stb. ilyen problémákat vetnek fel, mert toldalékokat nem külön mintában (mint 
például az angol kifejezések többségénél), hanem a szavakhoz hozzáragasztva használják. 
A morfológiai elemzésből egyértelműen megállapíthatjuk a legtöbb kifejezés szófaját és 
toldalékait, ám ezzel még nem biztos, hogy meg tudjuk ragadni a jelentését is. Ha a vizsgálat 
a szövegkörnyezettől függetlenül történik, könnyen juthatunk téves következtetésre pusztán 
a toldalékokból kiindulva. A homonímiák, vagyis azonos alakú, de eltérő jelentésű szavak 
félrevezethetik a gépi intelligenciát. 


14.4.3. A szövegkörnyezet figyelembevétele 


Valamely természetes nyelv nyelvészeti elemzésének alapvető célja az, hogy a nyelvtanilag 
helyes sorozatokat különválasszuk a nyelvtanilag helytelen sorozatoktól. A morfológiai 
elemzéssel elérhető formai (szintaktikai) helyesség nem garantálja a tartalmi (szemantikai) 
helyességet. Hiszen egy szó előfordulhat a megfelelő hangalakkal és írásmóddal nem 
megfelelő közegben. Bár nyelvtanilag nem vétenénk semmilyen hibát, nyilvánvalóan 
összezavarnánk beszélgetőtársunkat, ha azt mondanánk neki, hogy , leviszem a tejet sétálni". 
A morfológiai elemzés során felmerült homonímia-probléma kezelése lehetővé válik a 
mondatok szintjén, a kontextus megragadásával. 

Az említett két nyelvi szinten kívül létezik még kettő: pragmatikai és intencionális szint. 
Az előbbi a kifejezés gyakorlati, valódi értelmét jelzi, vagyis többértelmű jelentés esetén a 
megfelelő jelentésre utal, figyelembe véve a beszédhelyzetet (szituációt) és a szövegkörnye- 
zetet (kontextust). Az intencionális szint a szándékolt jelentést foglalja magában, vagyis azt, 
amire a beszélő utalni szeretne. 

Magához a nyelvtanhoz el lehet jutni intuíció, sejtés, mindenféle esetleges módszertani 
javaslatok, korábbi tapasztalatra való hagyatkozás stb. útján, a nyelvtan azonban összetett 
rendszer, részei közt sok és sokféle kapcsolat áll fenn. A homonímiák mellett a szinonimák 
is gondot okozhatnak az értelmezésben. Az utóbbiak alatt különböző alakú, ám hasonló 
jelentésű szavakat, szókapcsolatokat értünk. Egy gép számára az eb és a kutya szó kódjai 
különbözőek, így nem ismeri fel a kettő kapcsolatát. 


14.5. A felismerők képességeinek csoportosítási szempontjai 


e A beszédjel minősége: ezt befolyásolja a zajszint, a zaj típusa (stacionárius vagy 
gyorsan változó), a mikrofon ill. az átviteli csatorna minősége. 3 kategóriára lehet 
egyszerűsíteni: stúdióminőség, irodai minőség, telefonminőség. 


e A beszédmódja: lehet izolált szavas (egyetlen szót kell csak felismerni, ill. a szavak 
között rövid szünetet kell tartani), ill. folyamatos beszéd. 
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Beszélőfüggőség: egyetlen beszélő hangjára kell csak figyelni, beszélő függetlenség 
esetén bárkiére. A kettő között képez átmenetet az adaptív felismerő, amely fokozato- 
san megtanulja a beszélő hangját, azaz beszélő függetlenségből beszélő függővé alakul. 


A szótár mérete: hány szó fordulhat elő a beszédben. Kis szótáras felismerő 10-100, 
közepes 1-2 ezer, nagy szótáras pedig több tízezer szót képes felismerni. 


A nyelvi kötöttség foka: egy speciális szituációban (vonatjegy rendelése) a lehetséges 
mondatok mind szintaktikailag, mind szemantikailag rendkívül kötöttek, sőt a párbe- 
széd is modellezhető. 


Az emberekhez hasonlóan a gépi felismerőnek is szüksége van tanulásra, mind a nyelvi, 
mind az akusztikus információt valamilyen formában előre be kell vinni a rendszerbe. 
Ha egy nyelv szókészletének egy részével és hangjainak paramétereivel (spektrum, 
időbeli lefolyás) és kiejtési szabályaival betanítunk egy gépi felismerőt, akkor lehet 
esély arra, hogy önálló szavakat vagy hosszabb kifejezéseket gépi úton felismertessünk. 


Kötetlen, folyamatos beszéd felismeréséhez vagy a nagy háttérzajban történő felisme- 
réshez szükséges a nyelvi és tartalmi elemzés is, mint ahogy az ember is csak azt ismeri 
fel biztonságosan, amit megért. 


14.6. A gépi beszédfelismerés folyamata 


Akusztikus előfeldolgozás: melynek során a beszéd információtartalmát jellemző 
paramétereket határozzák meg. Ennek során eltávolítják a beszélőre, annak han- 
gulatára, és a környezetre vonatkozó adatokat. A beszédfelismerés célja a beszéd 
információtartalmának kinyerése. 


Mintaillesztés: Az előfeldolgozás után kapott paramétereket mintaillesztéssel vetik 
össze a referenciamintákkal vagy modellekkel, amelyeket a betanítás során készí- 
tenek és tárolnak el. A felismerés alapegységei lehetnek az egyes beszédhangok 
és ezek kombinációi (kettőshangok, hármas hangok, félszótagok, szótagok, szavak 
vagy akár hosszabb kifejezések). Az angolban és számos más nyelvben a szavak 
a legalkalmasabb alapegységek. A magyar nyelvben a ragozás, toldalékolás miatt 
minden szónak több száz vagy akár ezer alakja is lehet, ezért a szavaknál kisebb 
egységeket szokás választani. A beszédhangok nemcsak attól függenek milyen hang 
van előttük/utánuk, hanem az akusztikai környezettől, a beszélő személyétől, nemétől, 
szociális és regionális hovatartozásától stb. 


Nyelvi elemzés: az akusztikai illesztésnél legjobbnak bizonyult elemek sorozatából 
a legvalószínűbb szavakat vagy hosszabb szövegeket választhatjuk ki a szótárt és a 
nyelvtani ismereteket tároló tudásbázisból. A beszédhangokon, mint elemi egységeken 
alapuló, ún. nyílt szótáras felismerés lehetővé teszi, hogy új szavak egyszerűen 
felvehetők legyenek a szótárba. A modelleket nagymennyiségű, beszédhangokra 
szegmentált mintával kell betanítani. 
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14.7. Alkalmazási területek 


A beszédfelismerő alkalmazások egy részénél csak kényelmi vagy anyagi szempontok 
játszanak szerepet, máshol azonban a kéz és a szem felszabadítása az alapvető szempont. 
Ilyen alkalmazások például: 


e telefonálás vezetés közben, 

e diktálás sötétben (pl. röntgenezésnél), 

e leltározás terepen, 

. fogyatékosok számára használható rendszerek stb. 


Néhány konkrét példa: 

Napjainkban elszaporodtak a chat-botok (chatting robot — csevegő robot), amelyek 
különböző csatornákon található csevegőszobákban teljesítenek moderátori feladatot (auto- 
matikusan jogokat adhatnak bizonyos személyeknek stb.) vagy épp szórakoztatási szerepet 
játszanak (vicceket mesélnek, híreket mondanak stb.). 

A bűnüldözésben is használtak/használnak beszélgetőprogramokat, például pedofilok 
leleplezésére és kézrekerítésére. A netdadáknak (netnannies) nevezett botok fiataloknak 
álcázva magukat belépnek a tizenévesek által látogatott csevegőszobákba, és amikor egy 
pedofil-gyanús egyén megjelenik, magánbeszélgetésbe kezdenek vele, és kiderítenek róla 
annyi információt, amennyi csak lehetséges, majd jelentést küldenek a hatóságoknak. 

A genfi Agence Virtuelle RumorBotja is hasonló módszereket alkalmaz. A feladata a 
rémhírek kiszűrése. Napi több millió honlapot, emailt fésül át valós időben. 
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